엔비디아, 미스트랄 AI에 신형 GPU GB200 공급

작성일 12-04

<div id="layerTranslateNotice" style="display:none;"></div>  
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="K5Q9nDNdae">
          <figure class="figure_frm origin_fig" contents-hash="4fdd0b6bb8ba03885856d7af278a2bede7be24e35f426ec58681c4d5a352219c" dmcf-pid="9gYCFKu5NR" dmcf-ptype="figure">
           <p class="link_figure"><img alt="엔비디아, 미스트랄 AI에 신형 GPU GB200 공급" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/04/fnnewsi/20251204112546902ighr.png" data-org-width="800" dmcf-mid="bKIkW0ZvAd" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/04/fnnewsi/20251204112546902ighr.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            엔비디아, 미스트랄 AI에 신형 GPU GB200 공급
           </figcaption>
          </figure>
          <div contents-hash="f74e32264a732b21a531546fbc784e7104538cf669cfcc91555cfbf1fd15ee0d" dmcf-pid="2aGh3971AM" dmcf-ptype="general">
           <br>[파이낸셜뉴스] 엔비디아는 미스트랄 AI가 엔비디아 슈퍼컴퓨팅과 엣지 플랫폼 전반에 최적화된 오픈소스 다국어·멀티모달 모델 제품군 ‘미스트랄 3’를 발표했다고 4일 밝혔다. 미스트랄 3는 대규모 모델 ‘미스트랄 라지 3’와 경량 모델군 ‘미니스트랄 3’로 구성된다. 
          </div>
          <p contents-hash="5cfc29f77b7896b57b5fcd91f17f084501116fb135921e139eea452fd198dacf" dmcf-pid="VNHl02ztNx" dmcf-ptype="general">미스트랄 라지 3는 전문가 혼합 방식(MoE) 모델로, 모든 토큰마다 모든 뉴런을 구동하는 대신 가장 영향력이 큰 모델의 일부만 활성화한다. 이를 통해 불필요한 낭비 없이 확장성과 정확성을 동시에 제공한다. </p>
          <p contents-hash="105714a93477efb1a11e1e4cac40aa01b002bf5236a717d232f607216b76694f" dmcf-pid="fjXSpVqFaQ" dmcf-ptype="general">410억개의 활성 매개변수와 총 6750억개의 매개변수, 25만 6000개의 대용량 컨텍스트 윈도우를 갖춘 미스트랄 라지 3는 엔터프라이즈 인공지능(AI) 워크로드에 확장성, 효율성, 적응성을 제공한다. </p>
          <p contents-hash="7b161a762b43506ba337c41e77b6bdf62b6aa1dbac2e57cf67101acd3d5ee5e5" dmcf-pid="4AZvUfB3oP" dmcf-ptype="general">엔비디아 GB200 NVL72 시스템과 미스트랄 AI의 MoE 아키텍처를 결합함으로써 기업들은 방대한 AI 모델을 효율적으로 배포하고 확장할 수 있으며, 고도화된 병렬 처리와 하드웨어 최적화의 혜택을 누릴 수 있다. </p>
          <p contents-hash="5dc375570414843f017ea48103ee0da8bd726ce77a7d84ec862e093a32e388c9" dmcf-pid="8c5Tu4b0j6" dmcf-ptype="general">모델의 세분화된 MoE 아키텍처는 엔비디아 NV링크의 일관적인 메모리 도메인을 활용하고 광범위한 전문가 병렬 처리 최적화를 적용해 대규모 전문가 병렬 처리의 성능 이점을 극대화한다. </p>
          <p contents-hash="fce1a1f13cbaa194f8061b987b3addd9a3f3bc52bfaa787d1a9806fe5789ac16" dmcf-pid="6k1y78Kpg8" dmcf-ptype="general">이러한 이점은 정확성을 유지하는 저정밀도 NVFP4와 엔비디아 다이나모의 분산형 추론 최적화와 결합돼 대규모 훈련과 추론을 위한 최고 성능을 보장한다. </p>
          <p contents-hash="f2642bd63ac3fcbf76382f301cc7d3e8b7afd76bc1455508164573661797bb48" dmcf-pid="PEtWz69UA4" dmcf-ptype="general">GB200 NVL72에서 미스트랄 라지 3는 이전 세대인 엔비디아 H200 대비 10배의 성능 향상을 달성했다. 이러한 세대 간 성능 향상은 더 나은 사용자 경험, 토큰당 비용 절감, 에너지 효율 증대로 이어진다. </p>
          <p contents-hash="67c751718b0c87963ac8fed89cf6a34f51cec119265d11cc23fd49d09aaff19c" dmcf-pid="QDFYqP2ujf" dmcf-ptype="general">미스트랄 AI는 첨단 거대 언어 모델(LLM)의 기술 수준을 선도하는 데 그치지 않고, 개발자가 어디서든 AI를 실행할 수 있도록 지원하는 9개의 소형 언어 모델도 공개했다. </p>
          <p contents-hash="5f328fadc2333990629563c2b2ed155eb78aba95f0b650396132f33cd81e4724" dmcf-pid="xw3GBQV7aV" dmcf-ptype="general">소형의 미니스트랄 3 제품군은 엔비디아 스파크, RTX PC 또는 노트북, 엔비디아 젯슨 디바이스 등 엔비디아의 엣지 플랫폼 전반에서 실행되도록 최적화됐다. </p>
          <p contents-hash="e866d3ad2d63b0abf445afbe868693c3b91773c528f61b9f12b7333c1d7a63d9" dmcf-pid="yBaewTIkA2" dmcf-ptype="general">최상의 성능을 제공하기 위해 엔비디아는 라마.cpp, 올라마 등 주요 AI 프레임워크와 협력해 엔비디아 그래픽처리장치(GPU) 기반 엣지 환경 전반에서 뛰어난 성능을 구현한다. </p>
          <p contents-hash="7471e22334f7bde993a1948310da1e1b9eb873251491d1293434bc0a19478b57" dmcf-pid="WbNdryCEg9" dmcf-ptype="general">미스트랄 3 모델 제품군은 누구나 자유롭게 이용할 수 있어 전 세계 연구자와 개발자가 자유롭게 실험하고, 맞춤화하고, AI 혁신을 가속하며 최첨단 기술에 대한 접근을 폭넓게 확장할 수 있도록 한다. </p>
          <p contents-hash="eb3d2702fa511e5acdad88ae9e6b0546e3efd869cd4a3b5a1d2744a954d52cc6" dmcf-pid="YKjJmWhDaK" dmcf-ptype="general">미스트랄 AI의 모델을 데이터 디자이너, 커스터마이저, 가드레일, 네모 에이전트 툴킷 등 AI 에이전트 라이프사이클 개발을 위한 오픈소스 엔비디아 네모 도구에 연동함으로써, 기업은 자사 활용 사례에 맞춰 모델을 더욱 정교하게 맞춤화할 수 있다. 이로써 프로토타입 단계에서 제품화까지의 전환 속도를 한층 높일 수 있다. </p>
          <p contents-hash="13a3d034f0d8a5910f8824702ff858394a7ccec18616092ed32ea3193b359d19" dmcf-pid="GVkLIHvmcb" dmcf-ptype="general">클라우드부터 엣지까지 효율성을 확보하기 위해 엔비디아는 엔비디아 텐서RT-LLM, SGLang, vLLM 등 추론 프레임워크를 미스트랄 3 모델 제품군에 맞춰 최적화했다. </p>
          <p contents-hash="afe1f2e06b1fc15528af0df628e200ab119977c91f9e950b2207a007dc364313" dmcf-pid="HfEoCXTsoB" dmcf-ptype="general">미스트랄 3는 현재 주요 오픈소스 플랫폼과 클라우드 서비스 제공업체를 통해 이용할 수 있다. 조만간 엔비디아 NIM 마이크로서비스 형태로도 배포될 예정이다.</p>
          <p contents-hash="9376b8923c09f363c1acba166beaa98d9ce8992a660f2b3671879beb52ff1e57" dmcf-pid="X4DghZyOoq" dmcf-ptype="general">mkchang@fnnews.com 장민권 기자</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.</p>

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

엔비디아, 미스트랄 AI에 신형 GPU GB200 공급

멤버랭킹

관련자료

멤버랭킹