[컴퓨텍스 2026] 아닐 난두리 인텔 "AI 인프라, 더 넣는 시대 끝났다…제온6+·18A로 효율 승부" 작성일 06-02 44 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="2ASTfUKpyN"> <figure class="figure_frm origin_fig" contents-hash="f21c69eb8b831841cecee3fc2afd6838d093a3512218df6c0d1b7e30c32b961b" dmcf-pid="Vcvy4u9UTa" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/02/552796-pzfp7fF/20260602072936675iusc.jpg" data-org-width="640" dmcf-mid="9hAk3y5Thj" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/02/552796-pzfp7fF/20260602072936675iusc.jpg" width="658"></p> </figure> <p contents-hash="35e4bf71f8c3dff362b49a05c0f60c19722870528bc5f8c9570777dcb5a8f38c" dmcf-pid="fkTW872uSg" dmcf-ptype="general">[타이베이(대만)=디지털데일리 고성현기자] 인텔이 에이전틱 인공지능(AI) 시대의 인프라 효율화 방안으로 이기종 컴퓨팅(Heterogeneous Computing)을 지목했다. 특정 GPU나 단일 연산 자원에 의존하는 대신 CPU와 GPU, 특수 목적 가속기, 네트워크를 워크로드별로 조합해야 한다는 의미다. 공급 제약과 비용 부담이 커지는 상황에서 인텔은 제온6+와 18A 공정, 이더넷 솔루션을 앞세워 이 같은 변화에 대응하겠다는 구상이다.</p> <p contents-hash="d828ab1594a19a6e5c12defd40b0635dee15145ae280b519c648089713a7ad6a" dmcf-pid="42iLGOTsho" dmcf-ptype="general">아닐 난두리(Anil Nanduri) 인텔 데이터센터그룹 AI 제품 및 GTM 부사장은 1일 대만 타이베이 험블하우스 호텔에서 기자들과 만나 "지금까지 사람들은 빠르게 움직이면서 컴퓨팅 칩과 메모리, 스토리지를 더 넣는 식으로 대응했다"며 "그런데 이제 가격이 올랐고, 돈을 낼 수 있어도 구하지 못하는 상황이 되면서 각 요소를 잘하되 이를 통합하는 과정이 중요해졌다"고 말했다.</p> <p contents-hash="6b9bb1a306455fe9571f6c53c2bd8b82810a1cc48048b426b1ec31c170f21cb4" dmcf-pid="8VnoHIyOCL" dmcf-ptype="general">생성형 인공지능(AI) 확산 초기에는 투자비용을 확대하는 방식이 주류였다. 초기 시장 주도권을 잡아야만 입지를 다지는 만큼 비용보다 고도화에 집중했지만, 최근 공급 제약과 함께 비용 부담이 커지면서 보다 효율적인 방식이 우선시되고 있다는 의미다.</p> <p contents-hash="bae84ee39a1f2faae5b3c8a3a10581b4cab4b44c3c0ef3a0eb380f5b49d72b61" dmcf-pid="6fLgXCWISn" dmcf-ptype="general">이같은 변화는 AI가 학습 중심에서 추론과 실제 서비스 중심으로 이동하면서 더 뚜렷해지고 있다. AI 모델을 학습시킬 때는 대규모 GPU 연산이 중요하지만, 에이전틱 AI에서는 모델이 만든 결과를 실행하고 검증하고 외부 도구와 API를 호출하는 과정이 반복된다. 이 과정을 거치면서 GPU를 비롯한 CPU, 메모리, 네트워크와 소프트웨어 스택 등 세부 요소들의 중요성이 고루 커지는 분위기다.</p> <p contents-hash="ffb6e68f15234a15133347d7c20d45975b0602ca76c134d610754cd43526ffe5" dmcf-pid="P4oaZhYCCi" dmcf-ptype="general">그는 비용이 급증한 AI 인프라의 핵심 요소로 이기종 컴퓨팅을 지목했다. 하나의 칩이나 협력사에 맡기기보다 CPU와 GPU, 특수 목적에 맞는 AI가속기, 네트워크 등을 워크로드에 맞춰 조합하는 것이 비용과 성능 면에서 유리하다는 뜻이다.</p> <p contents-hash="c1348de822db4d76d9165679aaf7671b11286b293b725f8846ba024665f2d48d" dmcf-pid="Q8gN5lGhhJ" dmcf-ptype="general">특히 고성능 GPU, 메모리 등에 대한 공급 제약이 이러한 흐름을 더욱 가속화할 것으로 예상했다. 이전과 같은 규모의 경쟁이 불가능한 상황이 다가오는 만큼 데이터센터 차원에서의 자원 효율성을 높여야 한다는 의미로 해석된다.</p> <p contents-hash="544a36b126fb8c790d43d30035829511bff283fddda12b40d651eafcf19f0341" dmcf-pid="x6aj1SHlhd" dmcf-ptype="general">난두리 부사장은 "제약이 있으면 사람들은 창의적이 된다"며 "수요가 줄어든다고 보지는 않는다. 다만 기존 설치 기반과 새로 조달하는 자원을 얼마나 효과적으로 쓰느냐에 더 초점이 맞춰질 것"이라고 말했다.</p> <p contents-hash="cdf4f7931a423aa248f354b19199a1d2a992ab79a4edbf00cafe68af66d53af1" dmcf-pid="yS3pL6d8Te" dmcf-ptype="general">난두리 부사장은 인텔이 공개한 차세대 CPU '제온6+(코드명 클리어워터 포레스트)'가 이러한 추세에 힘을 더할 것으로 봤다. 이기종 컴퓨팅 환경에서 CPU가 맡아야 할 축을 감당할 수 있다는 이유에서다.</p> <p contents-hash="52787a2389757a36872adf38f91c87188e0ddeb2a7cc1a360e1682047318df1d" dmcf-pid="Wv0UoPJ6lR" dmcf-ptype="general">난두리 부사장은 "에이전틱으로 들어가면 CPU 자체도 맡아야 할 일이 있다"며 "코드를 실행하고 검증하며, 오케스트레이션하고, API 호출과 툴 호출을 실행해야 한다"고 강조했다. 특히 높은 코어 밀도와 전력 효율로 데이터센터 내 공간 효율성을 높일 수 있다는 강점도 제시했다.</p> <p contents-hash="1ca4b286b8026f3525d5ea7d62fecd6e98cdbaf32a861bc067201669827f145c" dmcf-pid="YTpugQiPTM" dmcf-ptype="general">그는 제온6+의 기반이 된 인텔의 자체 파운드리 공정 '인텔 18A(1.8나노급)'도 차별점이 될 수 있다고 강조했다. 전세계 대부분의 AI칩 수요가 TSMC에 쏠리며 생산능력을 초과하는 공급 차질이 발생하고 있는 만큼, 자체적으로 컴퓨팅 칩을 공급할 수 있는 인텔의 역량이 두드러질 수 있다는 의미다.</p> <p contents-hash="f41fa35276005ad3696f0ce9865df294dc0b6fa8d88d4c8433f8aa48b05d4d55" dmcf-pid="GyU7axnQhx" dmcf-ptype="general">난두리 부사장은 "공정 기술에 접근할 수 있다는 것은 큰 차별화 요소이자 이점"이라며 "전반적으로 컴퓨트 부족이 있고, 우리가 그 수요에 대응할 수 있다는 것은 우리에게 좋은 일"이라고 덧붙였다.</p> <p contents-hash="51be76cacce4c8e14c92194161bd0c09cdbe0ca7a1e865d4448dc01743019698" dmcf-pid="HY7qjRoMWQ" dmcf-ptype="general">특히 AI 인프라가 엔비디아 등 하나의 기업이 주도하는 환경이 이어지지 않을 것으로도 내다봤다. AI 모델이 성숙기에 접어들고 추론 활용이 늘수록 하나의 솔루션이 모든 인프라를 감당할 수 없게 되고, 공급 제약이 커질수록 각 기업이 상호 협력하는 환경이 만들어질 수 밖에 없다는 뜻으로 풀이된다.</p> <p contents-hash="1b2b3f1a7b475ac94ad9528c432f964847fa6bca1632e790c9a9a5f470466a6e" dmcf-pid="XGzBAegRWP" dmcf-ptype="general">현재 클라우드 중심인 AI 서비스 구조 역시 하이브리드 AI 구조에 접어들 것으로 봤다.</p> <p contents-hash="34729ba68d2abe0fa25e69a9f28a784cbb7a040d2f285961e2026bdeecf4df18" dmcf-pid="ZHqbcdaeC6" dmcf-ptype="general">난두리 부사장은 "로컬에서 무엇을 실행할 수 있고, 무엇을 하이브리드 모델로 전환해 클라우드로 보낼 것인가의 문제"라며 "많은 기본 검색증강생성(RAG) 쿼리는 오픈소스 모델을 로컬에서 실행하는 것으로 충분해지기 시작할 수 있다. 정말 프런티어 모델이나 API급 지능이 필요한 곳에 그런 귀중한 (클라우드의) 자원과 비용을 쓰게 될 것"이라고 전했다.</p> <p contents-hash="6fc82338c7b5994cbd761592ce23275d064cabc397ea110801675f33e8812d75" dmcf-pid="5XBKkJNdC8" dmcf-ptype="general">그는 데이터센터 내 랙과 랙 연결에 필요한 네트워크 영역 역시 더욱 확대될 것으로 예상했다. 난두리 부사장은 "(엔비디아의) NV링크는 GPU 대 GPU 연결이고, 이더넷 솔루션은 스케일아웃과 스케일업을 기반으로 한다"며 "고성능 영역에서는 400기가와 800기가 이더넷이 필요할 수 있지만, 높은 대역폭을 활용할 수 없거나 비용 최적화된 솔루션이 필요한 시장도 많이 있을 것"이라고 설명했다.</p> <p contents-hash="aa1a66fdb474db0537bd87c028c6909489351fa334b451cdd8a49d0a12d684b3" dmcf-pid="1Zb9EijJC4" dmcf-ptype="general">난두리 부사장은 "올바른 비용에 맞는 최적의 컴퓨트를 사용해야 한다. 다시 말하면 올바른 애플리케이션이나 워크로드를 올바른 비용으로 가장 적합한 컴퓨터에서 실행해야 한다는 뜻"이라며 "에이전틱 추론 데이터센터에서 올바른 이기종 조합이 무엇인지는 앞으로 진화와 혁신이 일어날 영역"이라고 말했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털데일리. All rights reserved. 무단 전재 및 재배포 금지.</p> 관련자료 이전 "LLM 다음은"…현실세계 이해하는 월드모델 경쟁 치열 06-02 다음 카누 유망주 6명, 카자흐스탄 주니어 아시아선수권 출전 06-02 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.