네이버클라우드 "AI 에이전트 시대 핵심은 GPU 효율증대 기술" 작성일 11-18 19 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">정권우 수석 ML엔지니어 "AI 에이전트 GPU 삼키는 하마"<br>"품질·속도·비용 균형이 개발 핵심…초기 속도 최적화는 독"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="XTqp4GCE5U"> <figure class="figure_frm origin_fig" contents-hash="b3a670f21e018957da023df5a807807fc944a0ae89f28c91f1659ba881bbb94e" dmcf-pid="ZyBU8HhDZp" dmcf-ptype="figure"> <p class="link_figure"><img alt="정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173115419updp.jpg" data-org-width="1400" dmcf-mid="YAiRc2UZYD" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173115419updp.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자 </figcaption> </figure> <p contents-hash="5df1a43b0638f1223441769c49ef1959aafde2ab01368003bd906c928a804c44" dmcf-pid="5Wbu6Xlw50" dmcf-ptype="general">(서울=뉴스1) 김민석 기자</p> <blockquote class="quote_frm" contents-hash="ea13d5fa6e57df94bb8d58a393b54dcdfad02b295e0ebdfe36f8d46df9537e39" dmcf-pid="1YK7PZSrH3" dmcf-ptype="blockquote1"> "사용자가 10배 늘더라도 GPU 사용량이 10배 늘지 않아야 합니다. 우리는 이용자가 10배 증가할 때 GPU는 2~3배만 증설해도 되독록 하는 기술을 적극 개발·검토하고 있습니다." </blockquote> <div contents-hash="d1acdea739164066edb4a02cc2e7ca28ff5119dad6a4eb6c0f885bcd513dee13" dmcf-pid="tG9zQ5vmYF" dmcf-ptype="general"> 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 18일 서울 강남구 코엑스에서 열린 '엔비디아 AI 서울 데이'에서 "AI 에이전트 핵심은 얼마나 비용 효율적으로 서비스할 수 있는가"라고 말했다. </div> <figure class="figure_frm origin_fig" contents-hash="6c874ca45d90d2eec54f0d20d73715765489b7ab8ce278bc60b1ad23aa37f60e" dmcf-pid="FH2qx1TsHt" dmcf-ptype="figure"> <p class="link_figure"><img alt="정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173116882yase.jpg" data-org-width="1400" dmcf-mid="GROwWox2XE" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173116882yase.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자 </figcaption> </figure> <p contents-hash="c6d0f2217f4a66b28d304a84341570180d1c6a533a2481afcc41454f52686e2c" dmcf-pid="3EXypmNdH1" dmcf-ptype="general">정 기술리더는 "생성형 AI에서 AI 에이전트로 전환되면서 GPU 인퍼런스 양이 10배에서 20배로 늘었다"며 "에이전트는 매 쿼리마다 여러 번의 모델 실행과 도구 호출이 필요하기 때문"이라고 설명했다.</p> <p contents-hash="1843257b5950d8fd6fc38ccea445bc55e7f8d77360223c94ce77f258c7f429bf" dmcf-pid="0DZWUsjJH5" dmcf-ptype="general">이어 "엔비디아의 동적 배치 처리 시스템(dynamic batching) 등 효율적 서빙 기능을 접목해 장기적으로 GPU 비용을 통제하는 방향으로 가고 있다"며 "에이전트 개발의 핵심은 품질은 높이고 에러율은 줄이는 것이다. 현재 GPU 환경과 개발자 인력으로 끌어올릴 수 있는 최고의 품질을 먼저 확보한 후 속도를 챙기고 비용을 줄이는 단계로 갈 것"이라고 언급했다.</p> <figure class="figure_frm origin_fig" contents-hash="751cc3c943a4c8d8eab1eab268d8a7c325801089749fee6b4b172ff28b42b772" dmcf-pid="pw5YuOAiGZ" dmcf-ptype="figure"> <p class="link_figure"><img alt="정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173118979ngbx.jpg" data-org-width="1400" dmcf-mid="HNgfnuZvZk" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173118979ngbx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자 </figcaption> </figure> <p contents-hash="663bd9ad23b0903702a6f9a6b0c962a892d0db22f026650b38a8eb525d7b6c45" dmcf-pid="Ur1G7IcnYX" dmcf-ptype="general">정 기술리더는 "이 순서를 지키는 이유는 근본적인 트레이드오프 때문"이라며 "초기부터 속도와 비용을 최적화하면 원하는 품질을 절대 달성할 수 없고 결국 이용자가 외면하는 에이전트가 나온다"고 진단했다.</p> <p contents-hash="d255178698441b2e4bca4fc919a8482114a022ec4ed4106621794767074ad6f6" dmcf-pid="umtHzCkL5H" dmcf-ptype="general">배희정 케이엠에스랩(KMSLAB) 대표도 최신 GPU 확보를 넘어 GPU를 효율적으로 사용할 수 있는 저전력 아키텍처 기술과 데이터 전처리를 통한 고효율 학습 기술 고도화에 나서야 한다고 제언한 바 있다.</p> <figure class="figure_frm origin_fig" contents-hash="cd336be07788b0581fbfd36f79b39a67ee269dd85d04453ef2ec22781987c710" dmcf-pid="7sFXqhEo5G" dmcf-ptype="figure"> <p class="link_figure"><img alt="정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173120598whpx.jpg" data-org-width="1400" dmcf-mid="4dKXqhEotf" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173120598whpx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 정권우 네이버 클라우드 수석 ML 엔지니어(기술 리더)가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 디지털 생태계 내 서비스 혁신과 성장을 위한 AI 에이전트 개발이란 주제로 발표하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자 </figcaption> </figure> <p contents-hash="b4686cf642f7d549a1c2916901edb297c1bf21b169d63110785a7e28f2abc552" dmcf-pid="zO3ZBlDgYY" dmcf-ptype="general">정 기술리더는 1분기 출시가 예정된 '쇼핑 에이전트'(에이전트N)와 관련 "핵심 시나리오는 2가지"라며 "정답형은 '손흥민 선수의 새로운 유니폼을 사고 싶다"는 명확한 구매 의도일 때 즉시 구매 링크를 제공하는 것이고 탐색형은 '아이가 밤에 기침을 하는데 가습기를 사줘야 할까' 등 모호할 땐 제품 설명과 선택 근거를 제시하는 것"이라고 말했다.</p> <p contents-hash="fd13b958b4910f7721aacc2364b1d383d5a1aeac44a57f2a089eab03d7d42682" dmcf-pid="qI05bSwatW" dmcf-ptype="general">이어 "쇼핑 에이전트가 동작했을 때 사용자 경험이 개선되는 것이 무엇보다 중요하다"며 "품질·속도·비용의 균형을 제대로 맞춰야 실제 서비스 단계에서 안정성과 장기적 경쟁력을 확보할 수 있을 것"이라고 내다봤다.</p> <figure class="figure_frm origin_fig" contents-hash="e2b29517274af9510648a9c686eeabd4ffe384570e57a62c68467cc587901fb5" dmcf-pid="BuePaBFY1y" dmcf-ptype="figure"> <p class="link_figure"><img alt="소우진 엔비디아 소룰션 아키텍트가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 발언하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173122095vdmk.jpg" data-org-width="1400" dmcf-mid="8oqp4GCEHV" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173122095vdmk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 소우진 엔비디아 소룰션 아키텍트가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 발언하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자 </figcaption> </figure> <p contents-hash="d573c3ff2da639ad537dfa568f092847e20d96004e10ab001baeba765122ae93" dmcf-pid="b7dQNb3GHT" dmcf-ptype="general">엔비디아는 NEMO 에이전트 툴킷을 활용해 네이버 클라우드가 구축 중인 에이전트 워크로드 일부를 통합하고 있다. 또 프로파일링 및 최적화 기능으로 추가적인 성능 개선 인사이트도 도출 중이다.</p> <p contents-hash="fba18450a8994ac0315472ffc60107dee68bb8079cd1f405ddda680d4ab0795d" dmcf-pid="KzJxjK0H5v" dmcf-ptype="general">소우진 엔비디아 설루션 아키텍트는 "엔비디아는 한국 정부, 네이버 클라우드를 비롯한 많은 한국 기업들과 손잡고 산업 전반에 걸쳐 AI 에이전트 시스템을 확장하고 있다"며 "이 과정에서 각 산업군에 특화한 AI 에이전트들이 대거 만들어질 것으로 기대한다"고 강조했다.</p> <figure class="figure_frm origin_fig" contents-hash="4db220a20b1ba5956808961088dbb5829021eb5c7386f2cefd6d0caeed9d1791" dmcf-pid="9qiMA9pX5S" dmcf-ptype="figure"> <p class="link_figure"><img alt="소우진 엔비디아 소룰션 아키텍트가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 발언하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173123654lzai.jpg" data-org-width="1400" dmcf-mid="HsePaBFY5u" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/18/NEWS1/20251118173123654lzai.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 소우진 엔비디아 소룰션 아키텍트가 서울 강남구 코엑스에서 열린 엔비디아 AI 서울 데이에서 발언하고 있다. 2025.11.18 뉴스1 ⓒ News1 김민석 기자 </figcaption> </figure> <p contents-hash="7b2c77596f4647bf71ffff70818a2b97744932027c75669198be097a3c75fb6f" dmcf-pid="2BnRc2UZ5l" dmcf-ptype="general">ideaed@news1.kr<br><br><strong><용어설명></strong><br><br>■ GPU 인퍼런스<br>GPU 인퍼런스(GPU inference)란 이미 학습된 인공지능(AI) 모델이 새로운 데이터를 받아 예측이나 답변을 생성하는 과정을 의미한다. 이 과정에서 GPU는 복잡한 연산을 빠르게 처리해 AI 모델의 결과를 실시간으로 도출하는 데 핵심 역할을 한다.<br><br>■ NeMo 에이전트 툴킷<br>엔비디아의 NeMo 에이전트 툴킷은 엔터프라이즈 환경에서 복잡한 AI 에이전트 워크플로를 구축하고 최적화·확장할 수 있도록 지원하는 오픈 소스 설루션이다. 다양한 AI 에이전트 프레임워크와 연동돼 실제 서비스 환경에서 성능(CoTPU·GPU 자원 효율 등), 워크플로 병목, 비용 요인 등을 분석·프로파일링해 운영 효율을 높인다.<br><br>■ 트레이드오프<br>트레이드오프란 어떤 것을 얻기 위해 반드시 다른 것을 포기해야 하는 선택의 상황을 의미한다. 경제학·경영학·IT 개발 등 다양한 분야에서 한 가지 목표를 달성하려면 다른 목표는 우선순위를 미뤄야 하는 상충 관계일 때 쓴다.<br><br> </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.</p> 관련자료 이전 산업 옥죄던 게임법, 싹 바뀐다는데…업계는 '이걸' 원한다 11-18 다음 KT 차기 CEO 공모에 지원한 유일한 KT 현직 임원은 누구 11-18 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.