AI 토큰값 90% 폭락해도 기업 부담 커진다는데, 왜? 작성일 03-30 33 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">2030년 추론 비용 100배 효율화 불구<br>AI 에이전트 확산으로 사용량 폭증해<br>단일 모델 집착 버리고 멀티 전략 짜야</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Ps7cshd8Jz"> <figure class="figure_frm origin_fig" contents-hash="dfd980885577efcddb163bb834063ab7205c9f1fa7846944b9d25f7d70d96c21" dmcf-pid="QOzkOlJ6n7" dmcf-ptype="figure"> <p class="link_figure"><img alt="가트너는 2030년까지 거대언어모델(LLM)의 추론 비용이 90% 이상 감소하고 모델 효율성도 최대 100배 개선될 것으로 전망했다. 그러나 AI 고도화로 토큰 수요가 급증하면서 전체 추론 비용은 오히려 증가할 수 있다고 분석했다. 이에 따라 기업 경쟁력은 단일 모델이 아닌 다양한 모델을 상황에 맞게 활용하는 ‘멀티 모델 오케스트레이션’ 전략에 달려 있다고 강조했다. <제미나이 생성 이미지>" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202603/30/mk/20260330104803994vohc.png" data-org-width="700" dmcf-mid="6SZJNkfzdq" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202603/30/mk/20260330104803994vohc.png" width="658"></p> <figcaption class="txt_caption default_figure"> 가트너는 2030년까지 거대언어모델(LLM)의 추론 비용이 90% 이상 감소하고 모델 효율성도 최대 100배 개선될 것으로 전망했다. 그러나 AI 고도화로 토큰 수요가 급증하면서 전체 추론 비용은 오히려 증가할 수 있다고 분석했다. 이에 따라 기업 경쟁력은 단일 모델이 아닌 다양한 모델을 상황에 맞게 활용하는 ‘멀티 모델 오케스트레이션’ 전략에 달려 있다고 강조했다. <제미나이 생성 이미지> </figcaption> </figure> <div contents-hash="fe5be53ad4ca920593db9f2ee28bc3c61e771670ec5f73e7ac9ac912a09271fc" dmcf-pid="xIqEISiPRu" dmcf-ptype="general"> 인공지능(AI) 모델의 핵심 단위인 ‘토큰’(Token) 단가가 오는 2030년까지 사실상 ‘제로’에 가깝게 폭락할 것이라는 전망이 나왔다. 하지만 아이러니하게도 기업들이 체감하는 AI 운용 비용은 줄어들지 않고 오히려 가중될 것으로 보여 경영진의 치밀한 비용 관리 전략이 요구되고 있다. </div> <p contents-hash="be096aea1d96d4f8249bf51f4ecbf19dbbd2905b9b56f1fdd04edd540b19edc6" dmcf-pid="yVDzV6ZvJU" dmcf-ptype="general">30일 가트너(Gartner)의 최신 보고서에 따르면 오는 2030년까지 1조 개(1000B) 파라미터를 가진 거대언어모델(LLM)의 추론 비용은 2025년 대비 90% 이상 감소할 것으로 관측된다. AI 토큰은 생성형 AI 모델이 처리하는 기본 데이터 단위로, 이번 가트너 분석에선 약 3.5바이트(약 4자)에 해당하는 데이터로 정의됐다.</p> <p contents-hash="b6c6f5fa3818b4846c17a27d346f85c3976d7816d5e0ea9b7a83123b4a318979" dmcf-pid="WfwqfP5TJp" dmcf-ptype="general">가트너는 이러한 급격한 단가 하락의 배경으로 반도체 및 인프라의 효율성 개선, 모델 설계의 혁신, 추론 특화 반도체의 확대 등을 꼽았다. 특히 2030년 시점의 LLM은 2022년 초기 동일 규모 모델과 비교했을 때 비용 효율성이 최대 100배까지 개선될 것으로 내다봤다.</p> <p contents-hash="eb192833103e152dac62573b0c36166428e7f1c3fd1bd3f3ad965545022c0535" dmcf-pid="Y4rB4Q1yd0" dmcf-ptype="general">다만 가트너는 토큰 단가 하락이 곧 기업의 AI 비용 절감이라는 낙관론에 대해선 선을 그었다. 기술이 고도화될수록 더 많은 토큰을 소비하는 구조적 변화가 일어나고 있기 때문이다.</p> <p contents-hash="f47f62e4ca3d3888f54ea6a27fb75e599ba168c3cf00045ad7f60592b6de4000" dmcf-pid="G8mb8xtWe3" dmcf-ptype="general">대표적인 예가 ‘AI 에이전트’다. 스스로 판단하고 작업을 수행하는 AI 에이전트는 기존 단순 챗봇 대비 작업당 최소 5배에서 최대 30배 더 많은 토큰을 사용한다. 토큰 단가는 떨어지더라도 전체 사용량이 이를 압도하면서 결과적으로 기업의 추론 비용 총액은 오히려 증가할 가능성이 크다는 분석이다.</p> <p contents-hash="e15d56fa7f63755cdd6fd244cb396d6fd2ddd7ae51ee03987ad477eabb170cb4" dmcf-pid="H6sK6MFYdF" dmcf-ptype="general">윌 소머 가트너 시니어 디렉터 애널리스트는 “제품 총괄 책임자(CPO)는 범용 토큰 가격 하락을 고급 추론 역량의 대중화로 오해해서는 안 된다”며 “기본적인 AI 기능은 사실상 제로 비용에 가까워지고 있지만, 고급 추론을 뒷받침하는 컴퓨팅 자원과 시스템은 여전히 희소하다”고 설명했다.</p> <p contents-hash="61d9859983a45c6089711fc252ad4dfb62aae95e686daeb8089cc4154b2a5cf2" dmcf-pid="XPO9PR3GJt" dmcf-ptype="general">그러면서 그는 “현재 저렴한 토큰 비용으로 아키텍처 비효율을 가리는 기업은 향후 에이전트 기반 AI 확장 단계에서 한계에 직면하게 될 것”이라고 덧붙였다.</p> <p contents-hash="9afd283d2f797aa2ccae089e4fd76ed4956dbac937c5ce75b22166fc9b41b69d" dmcf-pid="ZQI2Qe0HL1" dmcf-ptype="general">이에 따라 가트너는 미래 AI 경쟁력의 핵심이 단일 모델의 성능이 아닌 ‘멀티 모델 오케스트레이션’(Multi-model Orchestration)에 달려 있다고 강조했다.</p> <p contents-hash="02cd6c52a84438e6ff72dbf0a46c1c91d708de2d221798d28627b08444fb6a3a" dmcf-pid="5xCVxdpXJ5" dmcf-ptype="general">모든 워크로드를 고가의 프런티어 모델에 맡기기보다는 반복적이고 빈도가 높은 업무는 소형 모델(sLLM)이나 도메인 특화 모델로 처리하고, 고부가가치의 복잡한 추론에만 최첨단 모델을 투입하는 정교한 운영 능력이 기업의 생존을 결정지을 것이란 분석이다.</p> </section> </div> <p class="" data-translation="true">Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지</p> 관련자료 이전 청소년 10명 중 4명 사이버폭력 경험… "모르는 사람이 더 무섭다" 03-30 다음 한국인, 연간 보름꼴로 미세먼지·오존 등 4중 대기오염에 동시 노출 03-30 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.