베라 루빈 위험하다더니, 2년 뒤 인텔 TPU 국뽕에 취한 美 증시 작성일 06-09 20 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">거품 공포 팔며 미검증 미래엔 환호 <br>한국만 그런 줄 알았더니 아니네? <br>AI 시대가 드러낸 패권 본능의 민낯 <br>소버린 본색 드러낸 월가와 미국인</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="VF94yggRXy"> <figure class="figure_frm origin_fig" contents-hash="76156c86703133a81128d4d7b152c3bbf2b79c8570368c9e7db57cd341decdf2" data-idxno="459411" data-type="photo" dmcf-pid="f328WaaeHT" dmcf-ptype="figure"> <p class="link_figure"><img alt="젠슨황 엔비디아 CEO가 지난 6월 1일 대만 타이베이에서 개최된 2026년 컴퓨텍스에서 베라루빈 풀 세트를 소개하고 있다. / 이상헌 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/09/552814-8XPEppr/20260609232250078zuwa.jpg" data-org-width="1280" dmcf-mid="94Ri3mmjYY" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/09/552814-8XPEppr/20260609232250078zuwa.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 젠슨황 엔비디아 CEO가 지난 6월 1일 대만 타이베이에서 개최된 2026년 컴퓨텍스에서 베라루빈 풀 세트를 소개하고 있다. / 이상헌 기자 </figcaption> </figure> <p contents-hash="1bdec0429a8a357e84f0994d7d455a2352aa20e6e196f20746d832c8c0e7be08" dmcf-pid="40V6YNNdtv" dmcf-ptype="general">엔비디아와 구글의 차이는 더 이상 칩 한가지의 성능 비교로 설명되지 않는다. 한쪽은 AI 국가를 건설했고, 다른 한쪽은 요새 안에 갇혀 있다. 2026년 6월 현재 베라 루빈(Vera Rubin)은 TSMC 3나노에서 양산이 진행 중이고, 폭스콘·콴타·위스트론을 통한 본격 출하가 3분기부터 시작된다. 같은 시기 구글이 지난 4월 22일 공개한 8세대 TPU는 아직 프리뷰 단계다.</p> <p contents-hash="1e6c295693105d8610985795fe55835be89e2e65876d68812958e91aabb6ee25" dmcf-pid="8clyJuu5YS" dmcf-ptype="general">9일 월가에 따르면 젠슨 황 엔비디아 최고경영자(CEO)의 낙관론을 두고 "위험한 수준"이라는 비판이 나오는 가운데 정작 뉴욕 증시는 다른 방향으로 움직이고 있다. 블룸버그 칼럼니스트 슐리 렌은 최근 젠슨 황이 한국 방문 기간 "지금은 싸게 살 기회"라고 발언한 것을 두고 "닷컴 버블 당시와 같은 과도한 낙관을 경계해야 한다"고 지적했다. 그러나 같은 시기 AI 거품을 키운 것은 이미 양산에 들어간 베라 루빈이 아니라 2028년 생산 예정인 구글 TPU와 인텔 14A 계약이었다.</p> <p contents-hash="42066a74e8e6f5213e6141d7ae93cdb3afceab821c88fc56a657a77d22cf698d" dmcf-pid="6kSWi771Zl" dmcf-ptype="general">미국 IT 전문매체 더 인포메이션은 구글이 2028년 생산 예정인 차세대 TPU 300만 개 이상을 인텔 14A 공정에 맡기기로 했다고 밝혔다. 해당 보도가 나오자 인텔 주가는 하루 만에 11% 넘게 급등했다. 하지만 이 계약의 실체를 들여다보면 이미 양산 중인 AI 인프라와 아직 생산되지도 않은 미래 칩 사이의 간극이 드러난다.</p> <p contents-hash="257ed24a500892a2683b5545a54c415c53f0fe80576a4448628018c954bfd7fa" dmcf-pid="PEvYnzzt5h" dmcf-ptype="general">베라 루빈은 TSMC 3나노에서 생산돼 올해 3분기 출하를 앞두고 있는 반면, 구글 TPU는 여전히 프리뷰 단계에 머물러 있으며 인텔 14A 역시 대형 외부 고객 기준으로 검증되지 않은 공정이다. 엔비디아가 현재 진행형 인프라를 출하하는 동안 시장은 난데없이 2년 뒤 생산될 TPU와 미검증 공정의 결합에 프리미엄을 부여하고 있는 셈이다.</p> <p contents-hash="0a9d5ab3990d127e7507ef993883c96e0083ebbe31d0b7ffb1e864669b2fd558" dmcf-pid="QDTGLqqF5C" dmcf-ptype="general">구글 인프라 책임자 제프 딘(Jeff Dean)이 이끄는 TPU 8세대 설계의 핵심은 데이터를 칩 안에 가두는 것으로 알려졌다. 미디어텍이 설계한 추론용 TPU 8i의 핵심 사양은 온칩 SRAM 약 384MB로 추정됐다. 7세대가 HBM 메모리에 의존했다면, 8i는 추론 단계의 KV 캐시와 활성화 벡터를 가능한 한 실리콘 내부에 가두는 방향으로 설계됐다.</p> <p contents-hash="fd82015f4c85e0b05922962053dc8419eb8f3da2a255c949d28a46a87bfda8f2" dmcf-pid="xwyHoBB3XI" dmcf-ptype="general">구글이 인용한 수치도 이 철학을 반영한다. TPU 8t 선피시(Sunfish)가 엔비디아 GPU 대비 2.8배의 가격 대비 성능, TPU 8i가 달러당 80% 향상된 성능을 주장했다. 둘 다 동일한 연산을 더 적은 데이터 이동으로 처리한다는 메시지였다. 데이터 이동 비용을 줄이는 SRAM 중심 설계 철학의 정점이다.</p> <div contents-hash="e4435094e525968f9bbe5172728b45980657df99895fff86d5dfc55e286677d3" dmcf-pid="yBxdtwwa1O" dmcf-ptype="general"> 제프 딘의 설계 방향은 전자 물리학적으로 정직한 선택이다. 어텐션 연산 과정의 KV 캐시 폭증을 외부 메모리 왕복 없이 처리할 수 있다면 추론 지연 시간이 극적으로 줄어든다. 그러나 칩 안에 가둘 수 있는 SRAM 용량에는 물리적 한계가 있다. </div> <figure class="figure_frm origin_fig" contents-hash="f8465f98daddb88ec7e166e69f3993964bc6b18e135f1f31fafffaf0631f03bb" data-idxno="459409" data-type="photo" dmcf-pid="WbMJFrrN1s" dmcf-ptype="figure"> <p class="link_figure"><img alt="지난 24일 구글 수석 과학자 제프 딘이 공개한 TPU 8i 보드는 대형 금속 히트싱크와 냉각 구조가 얹힌 채 기판 위에 다수의 칩이 배열된 모습으로, 고밀도 연산을 전제로 한 데이터센터용 설계를 드러낸다. 특히 칩 패키지 주변을 둘러싼 두꺼운 인터포저와 정밀 배선은 온칩 SRAM 중심 구조와 초저지연 데이터 흐름을 강조하는 물리적 흔적이며, 단순 연산 유닛 집적이 아니라 메모리 접근 최소화와 칩 간 연결 최적화를 목표로 한 시스템 수준 아키텍처임을 시각적으로 보여준다. /해설=이상헌 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/09/552814-8XPEppr/20260609232251561ojml.png" data-org-width="1280" dmcf-mid="2zPR5EEoYW" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/09/552814-8XPEppr/20260609232251561ojml.png" width="658"></p> <figcaption class="txt_caption default_figure"> 지난 24일 구글 수석 과학자 제프 딘이 공개한 TPU 8i 보드는 대형 금속 히트싱크와 냉각 구조가 얹힌 채 기판 위에 다수의 칩이 배열된 모습으로, 고밀도 연산을 전제로 한 데이터센터용 설계를 드러낸다. 특히 칩 패키지 주변을 둘러싼 두꺼운 인터포저와 정밀 배선은 온칩 SRAM 중심 구조와 초저지연 데이터 흐름을 강조하는 물리적 흔적이며, 단순 연산 유닛 집적이 아니라 메모리 접근 최소화와 칩 간 연결 최적화를 목표로 한 시스템 수준 아키텍처임을 시각적으로 보여준다. /해설=이상헌 기자 </figcaption> </figure> <p contents-hash="e1fe3138c5a44a60e4c3296608d68e44effd17dd6d6565f640f4761ce2cc6e20" dmcf-pid="YKRi3mmjZm" dmcf-ptype="general"><strong>전차 앞세워 편제 항모 전단에 덤벼?</strong><br><strong>구글이 2년이나 늦어버린 현실 부정</strong></p> <p contents-hash="a165649802daaed829e38aff1e5be748110aae3d7b4b2bcc124928432e355a6a" dmcf-pid="G9en0ssA1r" dmcf-ptype="general">TPU(8t·8i)가 전차라면 베라 루빈은 이미 편제를 마친 기갑사단이라는 평가가 나오는 이유다. 구글의 384MB 온칩 SRAM은 단일 칩 기준으로는 거대한 공간이지만, 'Full-Stack AI Infrastructure Company'를 표방하는 엔비디아의 데이터센터 단위 KV 캐시·퍼스널 그래프·장기 기억 영역과 비교하면 한계가 곧장 드러난다.</p> <p contents-hash="345189f47d11844e372e9dfe79e8757fbab23742d087c0f04f5f5e37c5052597" dmcf-pid="H2dLpOOcYw" dmcf-ptype="general">엔비디아의 베라 루빈에는 단일 Groq 3 LPX 랙 한 대에 256개 Groq 3 LPU·128GB SRAM·40PB/s 대역폭이 들어간다. 일반 데이터센터 GPU의 온칩 SRAM이 수십~수백 MB임을 감안하면, 한 랙이 기존 GPU 수백 대 분의 SRAM을 한자리에 모아놓은 셈이다.</p> <p contents-hash="febac7ad6d55bf84c44ff86b2ed9f686d96a7de00c0cec4412063f7835ff62d3" dmcf-pid="XVJoUIIk5D" dmcf-ptype="general">베라 루빈 시스템 전체는 7개 계층으로 정리된다. 연산 계층에는 베라 CPU·루빈 GPU·Groq LPU·블루필드(BlueField) DPU가 모여 있다. 연결 계층은 NVLink 6·Spectrum-X·ConnectX가 담당한다. 메모리 계층은 HBM4와 SRAM이 다층 구조로 작동한다. 런타임 계층에는 CUDA·텐서RT·오픈셸·하네스가 자리한다. 단일 칩 경쟁의 시대를 끝내고 칩·패키지·랙·네트워크·소프트웨어·런타임·상태 공간까지 한 묶음으로 통합했다.</p> <p contents-hash="9d76eeeeb438f13ed1430ece15219c5d16f6185dc96ca94eb3a73a274e1ff189" dmcf-pid="ZfiguCCEXE" dmcf-ptype="general">이 구조는 단순한 시스템 통합이 아니다. 전 세계 인공지능의 연산과 기억, 네트워크와 추론, 상태와 런타임, 데이터센터와 에이전트를 통합하는 국가 건설 수준의 구조다. 칩이 시민이라면 NVLink는 도로이고, HBM은 시장이며, 퍼스널 그래프는 호적이고, NVL72 컴퓨트 트레이는 행정구역이다. 제프 딘이 뒤늦게 SRAM 성벽을 쌓고 있을 때 젠슨 황과 조나단 로스는 국가 자체를 세웠다.</p> <p contents-hash="b14afac6c1aa46c98d04f70ae8e1968af56dd300402e1794580bcd7adf067694" dmcf-pid="54na7hhD5k" dmcf-ptype="general">이 구조 차이는 양산 시점에서도 그대로 드러난다. 더 인포메이션 보도에 따르면 구글의 인텔 14A 공정 TPU 300만 개 발주는 2028년 양산을 목표로 한다. 앞서 모건스탠리는 구글이 2027~2028년 총 600만 개 TPU를 생산할 것으로 추산했다. 절반이 인텔 14A로 옮겨간다는 뜻이다. <strong>[AI칩 지정학] ⑧ 추론 오독의 비극 : 韓 창고 팔 때, 구글·엔비디아 SRAM 전쟁</strong></p> <p contents-hash="1d90b560f2296dc199cd56450311231239c8158cbbd7a141307bfa479121d646" dmcf-pid="18LNzllw5c" dmcf-ptype="general">반면 엔비디아는 2026년 TSMC 3나노에서 80만~85만 장의 웨이퍼를 발주했고, CoWoS 용량 59만5000장(글로벌 60%)을 선점했다. 페인만(Feynman) 차세대 아키텍처(2028)를 위해 인텔 18A 공정을 평가 중이지만 정식 발주는 하지 않았다. 검증되지 않은 노드에 미래를 베팅하지 않는 보수적 선택이다.</p> <p contents-hash="86b5442bb4b90784f39b2d65076eb7b14e6a4273d8491c2cd2ee038de6b490da" dmcf-pid="tQacbTTs1A" dmcf-ptype="general">반도체업계 한 관계자는 여성경제신문에 "인텔은 단순한 반도체 기업이 아니라 미국 자본시장의 상징적 자산 가운데 하나"라며 "블랙록·뱅가드 등 대형 기관투자자들이 오랫동안 주요 주주로 참여해 온 만큼 소버린 이상의 의미를 부여하는 경향이 있다"고 말했다.</p> <p contents-hash="fc3af527b3af93f7cfd21a17e928c9ab8c29374a3e0618907d3c5b921465743c" dmcf-pid="FxNkKyyOXj" dmcf-ptype="general">그는 "TSMC와 삼성전자로 이동한 첨단 제조 주도권을 되찾을 수 있다는 기대가 형성될 때마다 인텔 주가가 강하게 반응하는 이유도 여기에 있다"며 "이번 TPU 수주 역시 단순한 생산 계약을 넘어 미국 제조업 부활 서사와 연결해 해석하는 시각이 적지 않다"고 덧붙였다.</p> <p contents-hash="9b3ccfd2b032a8d605303ad3ee38b2ddc329f514597fba0bd1be929da3207f6c" dmcf-pid="3MjE9WWIGN" dmcf-ptype="general">한편 배경훈 과학기술정보통신부 장관이 젠슨 황으로부터 베라 루빈 최우선 공급 국가 확약을 받은 것으로 알려진 가운데 SK텔레콤·네이버·현대차그룹 등도 관련 인프라 구축 대열에 가세하고 있다. AI 반도체 경쟁이 국가 단위 AI 팩토리 구축 경쟁으로 확대되는 양상이다.</p> <p contents-hash="e95b23e9345e60dd570b7f6faea6ad548ef8a41c27d291b843ddfbaa6bec7866" dmcf-pid="0RAD2YYCGa" dmcf-ptype="general"><strong>☞ TPU 8t 선피쉬(Sunfish)와 8i 제브라피쉬(Zebrafish) </strong>= 구글이 2026년 공개한 8세대 TPU 아키텍처. 학습(Training)용인 8t Sunfish와 추론(Inference)용인 8i Zebrafish를 분리 설계한 것이 특징이다. 8t는 대규모 모델 학습과 파라미터 업데이트에 집중하고, 8i는 KV 캐시와 활성화 벡터를 온칩 SRAM에 최대한 유지해 추론 효율을 높이는 구조다. 제프 딘이 주도한 '학습과 추론의 기능 분리' 전략으로 평가된다.</p> <p contents-hash="7ec0b6a3270f70b779816d0e5e37ddd6941b6433d5db001d9b178d4fe8a578cd" dmcf-pid="pecwVGGhGg" dmcf-ptype="general">여성경제신문 이상헌 기자<br>liberty@seoulmedia.co.kr</p> <p contents-hash="a82474f0f1519ea16f9add7cf8764d1dcc8f76b0075f8eaa6f5d8faeebc401c8" dmcf-pid="UdkrfHHl5o" dmcf-ptype="general">*여성경제신문 기사는 기자 혹은 외부 필자가 작성 후 AI를 이용해 교정교열하고 문장을 다듬었음을 밝힙니다. 기사에 포함된 이미지 중 AI로 생성한 이미지는 사진 캡션에 밝혀두었습니다.</p> </section> </div> 관련자료 이전 남다른 2년차 두산 최민석…"10승까지 가볼게요" 06-09 다음 '김도영, 19호 홈런' KIA, 한화 꺾고 2연승 06-09 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.