"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

작성일 05-12

<div id="layerTranslateNotice" style="display:none;"></div>  <strong class="summary_view" data-translation="true">플래시 어텐션·쿠다 그래프 최적화…로컬 LLM 사용성·처리량 대폭 강화</strong> 
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="1jkhyTUlof">
          <p contents-hash="b6f71df8e3266616ca2fafc763496e36e61399d9bfaf3886c6afb9ac088a7870" dmcf-pid="tB9MiJrRNV" dmcf-ptype="general">(지디넷코리아=조이환 기자)엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다.</p>
          <p contents-hash="8df70ef0e4195cd5f6ad887aa650db16746482646d893c88ecc24d4ee99f1c94" dmcf-pid="Fb2Rnimeg2" dmcf-ptype="general">엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다.</p>
          <p contents-hash="e740a1f810bde4eb7206dbca5a6da141662624550adbdb868df43975b7255643" dmcf-pid="3KVeLnsdg9" dmcf-ptype="general">'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다.</p>
          <figure class="figure_frm origin_fig" contents-hash="b83d9e14cef3994e9128f73bfea6245f87cf6c8717ef1e78a086002b950ccbb7" dmcf-pid="09fdoLOJAK" dmcf-ptype="figure">
           <p class="link_figure"><img alt="엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. (사진=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/12/ZDNetKorea/20250512153328620jdzt.jpg" data-org-width="638" dmcf-mid="5KtBV2nbA4" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/12/ZDNetKorea/20250512153328620jdzt.jpg" width="658"></p>
           <figcaption class="txt_caption default_figure">
            엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. (사진=엔비디아)
           </figcaption>
          </figure>
          <p contents-hash="fdd64005cbb0e4baa80316571ae5cb2d2f8d00e5ec9e6d8230b3cafe2ed7f95b" dmcf-pid="p24JgoIiob" dmcf-ptype="general">새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다.</p>
          <p contents-hash="077cebcae37938087398c4dfcbf8595e939c6b55b5c164dd99ce438801f93d2f" dmcf-pid="UV8iagCngB" dmcf-ptype="general">시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다.</p>
          <p contents-hash="40001c0d5973d0399e04f0fa8deb902edf26e58c9920ba9a80db4aaf5090835b" dmcf-pid="uf6nNahLAq" dmcf-ptype="general">이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다.</p>
          <p contents-hash="a37c74325d720d1db512c6b777367c848c4e4f7735781bff2c7bc5d714817ed3" dmcf-pid="7H5z9KJqNz" dmcf-ptype="general">성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다.</p>
          <p contents-hash="b0645fcd7e2d1618ea8dbf7fa62e0dffdf2fcc5184e7cddf619f222c15942a87" dmcf-pid="zX1q29iBA7" dmcf-ptype="general">RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다.</p>
          <p contents-hash="44c63bc9fa0e9ca5f642476d5357cfdf4e80b0deccd79fe21e42c7babee0f721" dmcf-pid="qZtBV2nbAu" dmcf-ptype="general">'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다.</p>
          <p contents-hash="eaee85d4c7ecb73954598af36721fc8025d47fa90fb60b8428cb536b541156ff" dmcf-pid="B5FbfVLKjU" dmcf-ptype="general">엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.</p>
          <p contents-hash="754d141410c5b7f398c2174148df8649a18aa93baaec37b7b3ffa897fd87e99f" dmcf-pid="b13K4fo9Np" dmcf-ptype="general">조이환 기자(ianyhcho@zdnet.co.kr)</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>

이전

넥슨, ‘아크 레이더스’ 2번째 테크니컬 테스트 전투·접근성·몰입감 호평

05-12
다음

체육공단, 2025 스포츠 스타 체육교실 본격 추진

05-12

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

멤버랭킹

관련자료

멤버랭킹