"AI 비용 때문에 허리 휜다"…AI업계, 모델 경량화 개발에 집중 작성일 06-09 30 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">전체 기업의 90%, AI 관련 비용 증가<br>中 미니맥스 'M3' 등 경량화 모델이 트렌드</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="tL6Vrxx2jT"> <p contents-hash="8c0b79d9f07c892704a0b83c8ceb970912e36300bb6ff7fafee7914c6208a389" dmcf-pid="FoPfmMMVkv" dmcf-ptype="general">인공지능(AI) 도입으로 큰 폭의 수익 창출을 기대한 기업들이 AI 에이전트(비서) 사용량 폭증 탓에 오히려 막대한 비용 부담에 직면했다. AI 기업들은 고성능을 유지하면서도 구동 비용과 전력 소모를 낮춘 경량화된 AI 모델을 개발하며 기업 수요에 대응하고 있다.</p> <figure class="figure_frm origin_fig" contents-hash="bbf9eb6cf760ef05cd159a9d9154d47d4e7fb8ef57fab2f58c50a4ba867bc00e" dmcf-pid="3lkN1wwaaS" dmcf-ptype="figure"> <p class="link_figure"><img alt="중국 대표 인공지능(AI) 스타트업 '미니맥스'의 최신 AI 모델과 글로벌 AI 기업 앤스로픽의 클로드 오퍼스 4.8을 비교한 게시물. 버그를 잡아내는 성능은 같지만, 비용이 저렴하다고 강조하고 있다. 엑스(X) 캡처" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/09/akn/20260609103522791pdmh.jpg" data-org-width="745" dmcf-mid="1B1Hx33Gjy" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/09/akn/20260609103522791pdmh.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 중국 대표 인공지능(AI) 스타트업 '미니맥스'의 최신 AI 모델과 글로벌 AI 기업 앤스로픽의 클로드 오퍼스 4.8을 비교한 게시물. 버그를 잡아내는 성능은 같지만, 비용이 저렴하다고 강조하고 있다. 엑스(X) 캡처 </figcaption> </figure> <div contents-hash="fae2cc543da30d816466c56820155778421bff21955fa609587f4bd55b9efd5a" dmcf-pid="0SEjtrrNol" dmcf-ptype="general"> <p>9일 미국 컨설팅 업체 베인앤컴퍼니는 'AI 예산은 늘고 있지만 이익은 그렇지 않은 이유' 보고서에서 "전 세계 951개 기업을 조사한 결과, 37%가 AI 관련 비용을 11~20% 감축하려고 했지만 실제로는 0~10%에 그쳤다"고 밝혔다. 오히려 기업의 90%는 AI 관련 비용을 늘리는 중인 것으로 나타났다고 전했다.</p> </div> <p contents-hash="18fb7c4f59eafbf4b526eef06f47900135fbbc659bfdddeed52b497769cde879" dmcf-pid="pvDAFmmjgh" dmcf-ptype="general">미국 시장조사업체 가트너 역시 2030년까지 AI의 추론 비용이 현재 대비 90% 이상 감소할 것이라고 예상하면서도, 기업 및 개인이 지불해야 하는 AI 관련 비용은 늘어날 것이라고 내다봤다. AI가 단순 문답에서 그치지 않고 AI 에이전트로 진화하면서 작업 1회당 소비해야 하는 토큰 사용량이 증가할 것이라는 이유에서다. 가트너는 "토큰 단가가 빠르게 떨어지고 있지만 이용량 증가 속도가 이를 넘어선다"며 "고성능 AI를 위한 인프라는 여전히 제한된 자원으로 남아 있어 비용 압박이 지속될 것"이라고 설명했다.</p> <p contents-hash="9f643af8d828b3155a548ab200ecf1f3fc485225aaee53caf4a791b61d6121d1" dmcf-pid="UTwc3ssAjC" dmcf-ptype="general">상황을 인식한 AI 기업들은 AI 경량화 경쟁에 돌입했다. 중국 대표 AI 스타트업 '미니맥스'는 이달 1일 최신 AI 모델 'M3'를 공개했다. M3는 코딩 에이전트 및 업무 자동화 기능을 제공하면서도 비용은 미국 주요 폐쇄형 AI 모델의 5~10% 수준에 불과하다. 그러면서도 소프트웨어 엔지니어링 능력을 평가하는 'SWE-벤치 프로'에서 59%를 기록하는 등 구글의 생성형 AI 모델 제미나이 3.1프로를 앞서기도 했다. 미국의 반도체 기업 '시마AI'는 저전력 칩 기반 피지컬AI 시장 확대에 집중하고 있다. 시마AI의 머신러닝 시스템온칩(MLSoC) '모달릭스'는 10와트 미만의 저전력 환경에서도 대규모언어모델(LLM) 등을 처리할 수 있도록 설계됐다.</p> <p contents-hash="035f91ab71e072409396d0d26e4e93209e47d928c52b9ae84eacd6ee3adb4515" dmcf-pid="uyrk0OOcjI" dmcf-ptype="general">국내 AI업계도 AI 경량화에 관심을 보이고 있다. AI 스타트업 노타는 AI 모델 경량화 플랫폼 '넷츠프레소'를 개발했다. 넷츠프레소를 통해 크고 복잡한 AI 모델을 기업의 환경에 맞춰 효율적으로 만들 수 있다. 노타는 넷츠프레소 기술을 기반으로 지능형 교통 상황 모니터링 시스템을 구축할 방침이다.</p> <p contents-hash="9fd89cc0e67e8223d085c0765d51ba3a7e6e11602439e8ecedfe3943ce64a0b2" dmcf-pid="7WmEpIIkjO" dmcf-ptype="general">국내 AI 스타트업 액션파워도 AI 기반 필기 애플리케이션 '다글로'를 바탕으로 모델 경량화 및 추론 최적화 작업을 진행 중이다. 10여년간 축적한 음성 및 텍스트 데이터의 경쟁력으로 그래픽처리장치(GPU)와 신경망처리장치(NPU) 등 하드웨어 특성에 맞춰 추론 구조를 최적화할 수 있다. 액션파워 측은 "경량화 모델은 고사양 GPU 의존도를 낮춰 기업 폐쇄망 기반 온프레미스(On-Premises·기업이 자체 시설에 직접 IT 인프라 설치하는 것) AI 환경에서도 효율적으로 활용할 수 있다"며 "향후 초경량 AI 모델 기반 온디바이스 AI 시장도 본격 공략할 것"이라고 밝혔다.</p> <p contents-hash="0dd899a8740f30505ad5eb161112876b14d24a6fd3b37f4fbd17aed513b745c4" dmcf-pid="zYsDUCCEgs" dmcf-ptype="general">공병선 기자 mydillon@asiae.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 아시아경제. 무단전재 및 재배포 금지.</p> 관련자료 이전 [유미's 픽] 젠슨 황 만난 LG·SKT·업스테이지…독자 AI 2차전 변수될까 06-09 다음 'AI 지각생' 애플, 갤럭시 AI 넘을 혁신은 없었다[IT썰] 06-09 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.