네이버클라우드 "AI 에이전트 시대 핵심은 GPU 효율증대 기술"

작성일 11-18

<div id="layerTranslateNotice" style="display:none;"></div> 정권우 수석 ML엔지니어 "AI 에이전트 GPU 삼키는 하마" "품질·속도·비용 균형이 개발 핵심…초기 속도 최적화는 독" 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="XTqp4GCE5U">
 <figure class="figure_frm origin_fig" contents-hash="b3a670f21e018957da023df5a807807fc944a0ae89f28c91f1659ba881bbb94e" dmcf-pid="ZyBU8HhDZp" dmcf-ptype="figure">
 <img alt="정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173115419updp.jpg" data-org-width="1400" dmcf-mid="YAiRc2UZYD" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173115419updp.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자
 </figcaption>
 </figure>
 (서울=뉴스1) 김민석 기자
 <blockquote class="quote_frm" contents-hash="ea13d5fa6e57df94bb8d58a393b54dcdfad02b295e0ebdfe36f8d46df9537e39" dmcf-pid="1YK7PZSrH3" dmcf-ptype="blockquote1">
 "사용자가 10배 늘더라도 GPU 사용량이 10배 늘지 않아야 합니다. 우리는 이용자가 10배 증가할 때 GPU는 2~3배만 증설해도 되독록 하는 기술을 적극 개발·검토하고 있습니다."
 </blockquote>
 <div contents-hash="d1acdea739164066edb4a02cc2e7ca28ff5119dad6a4eb6c0f885bcd513dee13" dmcf-pid="tG9zQ5vmYF" dmcf-ptype="general">
 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 18일 서울 강남구 코엑스에서 열린 '엔비디아 AI 서울 데이'에서 "AI 에이전트 핵심은 얼마나 비용 효율적으로 서비스할 수 있는가"라고 말했다.
 </div>
 <figure class="figure_frm origin_fig" contents-hash="6c874ca45d90d2eec54f0d20d73715765489b7ab8ce278bc60b1ad23aa37f60e" dmcf-pid="FH2qx1TsHt" dmcf-ptype="figure">
 <img alt="정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173116882yase.jpg" data-org-width="1400" dmcf-mid="GROwWox2XE" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173116882yase.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자
 </figcaption>
 </figure>
 정 기술리더는 "생성형 AI에서 AI 에이전트로 전환되면서 GPU 인퍼런스 양이 10배에서 20배로 늘었다"며 "에이전트는 매 쿼리마다 여러 번의 모델 실행과 도구 호출이 필요하기 때문"이라고 설명했다.
 이어 "엔비디아의 동적 배치 처리 시스템(dynamic batching) 등 효율적 서빙 기능을 접목해 장기적으로 GPU 비용을 통제하는 방향으로 가고 있다"며 "에이전트 개발의 핵심은 품질은 높이고 에러율은 줄이는 것이다. 현재 GPU 환경과 개발자 인력으로 끌어올릴 수 있는 최고의 품질을 먼저 확보한 후 속도를 챙기고 비용을 줄이는 단계로 갈 것"이라고 언급했다.
 <figure class="figure_frm origin_fig" contents-hash="751cc3c943a4c8d8eab1eab268d8a7c325801089749fee6b4b172ff28b42b772" dmcf-pid="pw5YuOAiGZ" dmcf-ptype="figure">
 <img alt="정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173118979ngbx.jpg" data-org-width="1400" dmcf-mid="HNgfnuZvZk" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173118979ngbx.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자
 </figcaption>
 </figure>
 정 기술리더는 "이 순서를 지키는 이유는 근본적인 트레이드오프 때문"이라며 "초기부터 속도와 비용을 최적화하면 원하는 품질을 절대 달성할 수 없고 결국 이용자가 외면하는 에이전트가 나온다"고 진단했다.
 배희정 케이엠에스랩(KMSLAB) 대표도 최신 GPU 확보를 넘어 GPU를 효율적으로 사용할 수 있는 저전력 아키텍처 기술과 데이터 전처리를 통한 고효율 학습 기술 고도화에 나서야 한다고 제언한 바 있다.
 <figure class="figure_frm origin_fig" contents-hash="cd336be07788b0581fbfd36f79b39a67ee269dd85d04453ef2ec22781987c710" dmcf-pid="7sFXqhEo5G" dmcf-ptype="figure">
 <img alt="정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173120598whpx.jpg" data-org-width="1400" dmcf-mid="4dKXqhEotf" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173120598whpx.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자
 </figcaption>
 </figure>
 정 기술리더는 1분기 출시가 예정된 '쇼핑 에이전트'(에이전트N)와 관련 "핵심 시나리오는 2가지"라며 "정답형은 '손흥민 선수의 새로운 유니폼을 사고 싶다"는 명확한 구매 의도일 때 즉시 구매 링크를 제공하는 것이고 탐색형은 '아이가 밤에 기침을 하는데 가습기를 사줘야 할까' 등 모호할 땐 제품 설명과 선택 근거를 제시하는 것"이라고 말했다.
 이어 "쇼핑 에이전트가 동작했을 때 사용자 경험이 개선되는 것이 무엇보다 중요하다"며 "품질·속도·비용의 균형을 제대로 맞춰야 실제 서비스 단계에서 안정성과 장기적 경쟁력을 확보할 수 있을 것"이라고 내다봤다.
 <figure class="figure_frm origin_fig" contents-hash="e2b29517274af9510648a9c686eeabd4ffe384570e57a62c68467cc587901fb5" dmcf-pid="BuePaBFY1y" dmcf-ptype="figure">
 <img alt="소우진 엔비디아 소룰션 아키텍트가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 발언하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173122095vdmk.jpg" data-org-width="1400" dmcf-mid="8oqp4GCEHV" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173122095vdmk.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 소우진 엔비디아 소룰션 아키텍트가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 발언하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자
 </figcaption>
 </figure>
 엔비디아는 NEMO 에이전트 툴킷을 활용해 네이버 클라우드가 구축 중인 에이전트 워크로드 일부를 통합하고 있다. 또 프로파일링 및 최적화 기능으로 추가적인 성능 개선 인사이트도 도출 중이다.
 소우진 엔비디아 설루션 아키텍트는 "엔비디아는 한국 정부, 네이버 클라우드를 비롯한 많은 한국 기업들과 손잡고 산업 전반에 걸쳐 AI 에이전트 시스템을 확장하고 있다"며 "이 과정에서 각 산업군에 특화한 AI 에이전트들이 대거 만들어질 것으로 기대한다"고 강조했다.
 <figure class="figure_frm origin_fig" contents-hash="4db220a20b1ba5956808961088dbb5829021eb5c7386f2cefd6d0caeed9d1791" dmcf-pid="9qiMA9pX5S" dmcf-ptype="figure">
 <img alt="소우진 엔비디아 소룰션 아키텍트가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 발언하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173123654lzai.jpg" data-org-width="1400" dmcf-mid="HsePaBFY5u" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173123654lzai.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 소우진 엔비디아 소룰션 아키텍트가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 발언하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자
 </figcaption>
 </figure>
 ideaed@news1.kr &lt;용어설명&gt; ■ GPU 인퍼런스 GPU 인퍼런스(GPU inference)란 이미 학습된 인공지능(AI) 모델이 새로운 데이터를 받아 예측이나 답변을 생성하는 과정을 의미한다. 이 과정에서 GPU는 복잡한 연산을 빠르게 처리해 AI 모델의 결과를 실시간으로 도출하는 데 핵심 역할을 한다. ■ NeMo 에이전트 툴킷 엔비디아의 NeMo 에이전트 툴킷은 엔터프라이즈 환경에서 복잡한 AI 에이전트 워크플로를 구축하고 최적화·확장할 수 있도록 지원하는 오픈 소스 설루션이다. 다양한 AI 에이전트 프레임워크와 연동돼 실제 서비스 환경에서 성능(CoTPU·GPU 자원 효율 등), 워크플로 병목, 비용 요인 등을 분석·프로파일링해 운영 효율을 높인다. ■ 트레이드오프 트레이드오프란 어떤 것을 얻기 위해 반드시 다른 것을 포기해야 하는 선택의 상황을 의미한다. 경제학·경영학·IT 개발 등 다양한 분야에서 한 가지 목표를 달성하려면 다른 목표는 우선순위를 미뤄야 하는 상충 관계일 때 쓴다. 
 </section> 
 </div> 
 Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이전

산업 옥죄던 게임법, 싹 바뀐다는데…업계는 '이걸' 원한다

11-18
다음

KT 차기 CEO 공모에 지원한 유일한 KT 현직 임원은 누구

11-18

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

네이버클라우드 "AI 에이전트 시대 핵심은 GPU 효율증대 기술"

멤버랭킹

관련자료

멤버랭킹