“AI 인프라 경쟁, 칩 아닌 소프트웨어에 좌우”

작성일 04-13

<div id="layerTranslateNotice" style="display:none;"></div> 엔비디아, 종속 구조로 점유율 높이기 전략 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="ZlE8EyRfzb">
 <figure class="figure_frm origin_fig" contents-hash="f94d2fcd76691dc1eba72a081502ad2c420f500bca74899445b4c9a299775525" data-idxno="233455" data-type="photo" dmcf-pid="5SD6DWe40B" dmcf-ptype="figure">
 <img alt="엔비디아 본사 전경. / 사진=연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/13/552777-a6ToU27/20260413092330807izst.jpg" data-org-width="600" dmcf-mid="XGvLv0Ai7K" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/13/552777-a6ToU27/20260413092330807izst.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 엔비디아 본사 전경. / 사진=연합뉴스
 </figcaption>
 </figure>
 [시사저널e=송주영 기자] AI 인프라 경쟁이 반도체 성능 중심에서 소프트웨어 생태계로 이동하는 흐름이다. 동일한 AI 반도체를 사용하더라도 소프트웨어 최적화 수준에 따라 실제 처리 성능이 최대 3배 이상 차이 나는 것으로 나타나면서다.
 소프트웨어정책연구소가 지난 10일 발간한 보고서에 따르면 올해 전 세계 AI 지출은 2조5000억달러(3722조원)에 이를 전망이며 이 중 절반 이상이 서버, 가속기, 데이터센터 등 인프라에 집중된다. 이 시장에서 엔비디아는 데이터센터 GPU 매출의 약 86%를 차지하며 독보적 지위를 유지하고 있다.
 보고서는 이 같은 격차의 원인을 반도체 성능이 아닌 소프트웨어 생태계로 규정했다. 동일한 GPU를 사용하더라도 소프트웨어 최적화 수준에 따라 실제 처리량이 크게 달라지기 때문이다.
 엔비디아 경쟁력 핵심은 CUDA를 중심으로 축적된 소프트웨어 생태계란 지적이다. 지난 2006년 출시 이후 약 20년간 개발자 도구, 라이브러리, 교육 자료, 커뮤니티가 누적되며 경쟁사가 단기간에 따라오기 어려운 구조가 형성됐다.
 강호준 소프트웨어정책연구소 선임연구원은 "CUDA 생태계는 단순한 개발도구가 아니라 개발자와 애플리케이션을 묶어두는 네트워크 효과를 만든다"며 "이 구조가 하드웨어 교체 비용을 높이는 핵심 요인"이라고 설명했다.
 AI 인프라는 프레임워크, 컴파일러, 가속 라이브러리, 드라이버·런타임 등 4개 소프트웨어 계층으로 구성되며 이 각 계층이 하드웨어 선택에 영향을 미친다. 이 과정에서 특정 기술 선택이 다른 선택지를 제한하는 '종속 구조(lock-in)'가 형성됐다.
 보고서는 특히 드라이버 계층의 폐쇄성이 가장 강력한 장벽으로 작용한다며 상위 소프트웨어가 개방형이라도 최종 실행은 특정 반도체 제조사의 환경을 통과해야 한다고 설명했다.
 엔비디아가 성능과 구조적 종속을 결합한 전략을 취했다면, 구글은 설계 단계에서 종속을 구축하는 방식을 선택했다. 구글은 TPU와 XLA 컴파일러, JAX 프레임워크를 결합해 하나의 통합 구조를 만들었다.
 프레임워크 선택이 곧 하드웨어 선택으로 이어지는 구조다. 보고서는 이 방식은 성능 최적화 측면에서 유리하지만 클라우드 환경에 대한 의존도를 높이는 한계가 있다고 분석했다.
 중국은 또 다른 방식으로 접근하고 있다. 화웨이는 어센드, CANN 소프트웨어, 마인드스포처 프레임워크를 결합해 독자 생태계를 구축하고 있다. 보고서는 이를 엔비디아의 종속 구조를 복제하는 전략으로 분석했다.
 이 같은 종속 구조에도 변화다 나타났다. vLLM, SGLang 등 오픈소스 기반 추론 소프트웨어가 등장하면서 일부 종속 구조를 완화하는 흐름이 형성되고 있다.
 보고서는 추론 서빙 소프트웨어의 효율성이 인프라 총소유비용(TCO)을 결정하는 핵심 변수로 부상하고 있다고 분석했다.
 특히 추론은 서비스 운영 과정에서 지속적으로 비용이 발생하는 구조이기 때문에 소프트웨어 최적화 효과가 직접적인 비용 절감으로 이어진다.
 강 선임연구원은 "오픈소스 추론 엔진은 특정 하드웨어 종속을 완화할 수 있는 중요한 변수"라면서도 "최종적으로는 드라이버 계층의 구조적 종속이 남아 있어 완전한 대체는 쉽지 않다"고 평가했다.
 보고서는 한국 NPU 생태계를 프레임워크 진입에는 성공했지만 성능과 운영 생태계에서 한계를 보이는 단계로 진단했다.
 리벨리온, 퓨리오사AI 등 기업들은 파이토치(PyTorch) 호환성과 vLLM 연동을 통해 초기 진입 장벽은 넘었다. 그러나 컴파일러와 라이브러리 최적화 수준, 운영 레퍼런스 부족이 시장 확산을 제약하고 있다.
 보고서는 성능 격차가 해소되지 않으면 실제 적용 사례가 쌓이지 않고, 적용 사례가 부족하면 투자도 어려운 순환 구조가 형성된다고 설명했다. 이어 자체 소프트웨어 스택을 구축했지만 기존 CUDA 생태계와의 호환성이 부족해 전환 유인이 떨어지는 역설적 상황이라고 지적했다.
 단순한 반도체 개발만으로는 시장 진입이 어려운 구조란 분석이다.
 </section> 
 </div> 
 Copyright © 시사저널e 무단전재 및 재배포 금지

이전

스마트폰 ‘세계 1위’ 탈환한 삼성…‘갤럭시 S26’ 흥행 열풍 어디까지

04-13
다음

쌓는 낸드 'HBF' 공정 시장 열렸다…샌디스크 공급망 구축 개시

04-13

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

“AI 인프라 경쟁, 칩 아닌 소프트웨어에 좌우”

멤버랭킹

관련자료

멤버랭킹