KT '믿:음 K', 글로벌 AI 평가서 국내 중소형 모델 1위 작성일 01-05 10 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">에이전트 성능 최정상 수준… 한국 기업 위한 ‘에이전틱 AI’ 솔루션 제시</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="8Kpz0eqFhU"> <p contents-hash="c201bb4ecb4101539ce4a6d9f6a2edf529a7ccfca95e97a4e4a9b3340bb49869" dmcf-pid="6GhTC7yOvp" dmcf-ptype="general">[아이뉴스24 서효빈 기자] KT는 자체 개발한 인공지능(AI) 모델 '믿:음 K'가 글로벌 AI 모델 성능 종합 평가 플랫폼 'AAII'에서 국내 중소형 모델 가운데 1위를 차지했다고 5일 밝혔다.</p> <figure class="figure_frm origin_fig" contents-hash="99cb415c0071330ebcff9e5faee0fd31dcf732d94fee411d66b6ff6c75042e26" dmcf-pid="PHlyhzWIT0" dmcf-ptype="figure"> <p class="link_figure"><img alt="AAII(Artificial Analysis Intelligence Index)’에 등재된 믿:음 K [사진=AAII]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/05/inews24/20260105103406440ptyv.jpg" data-org-width="580" dmcf-mid="4RuBUJb0Wu" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/05/inews24/20260105103406440ptyv.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> AAII(Artificial Analysis Intelligence Index)’에 등재된 믿:음 K [사진=AAII] </figcaption> </figure> <p contents-hash="044db23131557db35fe7308443c841f6902a237cb77a61eb1184c37f87627460" dmcf-pid="QXSWlqYCv3" dmcf-ptype="general">AAII는 AI 평가 전문 기관 Artificial Analysis가 운영하는 글로벌 평가 플랫폼이다. 단일 시험이 아닌 다수의 공개 벤치마크 결과를 종합해 전 세계 주요 AI 모델 성능을 비교한다. 국내 주요 AI 모델로는 LG 엑사원, 네이버 하이퍼클로바, 업스테이지 솔라, 모티프 등이 함께 등재돼 있다.</p> <p contents-hash="4619dddb9c584d37b62c7d4677ec8f87361b0464b950e805d93be118710fc6af" dmcf-pid="xZvYSBGhlF" dmcf-ptype="general">이번 평가에서 '믿:음 K'는 추론, 전문 지식, 수학·프로그래밍, 에이전트 수행 능력 등 10여 개 핵심 평가 항목에서 고른 점수를 기록했다. 사용자의 질문에 응답하는 데 그치지 않고 목표를 이해한 뒤 필요한 시스템과 도구를 활용해 과업을 수행하는 에이전틱 AI로서의 경쟁력을 공식적으로 인정받았다.</p> <p contents-hash="2ecfc8627c75e1b50193261b708d2745244f4cd22788446c2f44c6276284d572" dmcf-pid="yiPR6we4lt" dmcf-ptype="general">특히 KT의 '믿:음 K'는 주요 에이전트 성능 벤치마크 중 하나인 'τ²-bench(타우 스퀘어 벤치)'에서 87%를 기록했다. τ²-bench는 AI가 실제 업무 환경에서 사람과 협업하며 여러 도구를 활용해 과업을 끝까지 수행할 수 있는지를 평가하는 지표다. 해당 점수는 구글 최신 모델 제미나이3와 유사한 수준이다.</p> <p contents-hash="93f8d240fc0b040e55411e7a8b78cce0e8cdfb95c335e4a9c6610a2cd0beb7f6" dmcf-pid="WnQePrd8h1" dmcf-ptype="general">KT는 '믿:음 K'가 기업 내부 업무 자동화, 문서 분석과 작성, 소프트웨어 개발, 서버 관리 등 실무 중심 영역에서 인간 개입을 최소화하고 자율적으로 과업을 수행할 수 있는 '실전형 AI'로 평가받았다고 설명했다.</p> <p contents-hash="13af887fd950577070dd803f077a42550cd2d892cb33cf269a381313a5944cec" dmcf-pid="YLxdQmJ6C5" dmcf-ptype="general">오승필 KT 기술혁신부문장 부사장은 "이번 AAII 등재는 KT의 자체 AI 기술력이 글로벌 기준에 도달했음을 입증한 성과"라며 "에이전틱 AI를 통해 한국 기업의 업무 혁신과 디지털 전환을 이끄는 AI 파트너가 되겠다"고 말했다.</p> <address contents-hash="2a08d6469f26e1edb360cc3088c237a132f28b44c5da19a5cb91820e94fd10d3" dmcf-pid="GoMJxsiPvZ" dmcf-ptype="general">/서효빈 기자<span>(x40805@inews24.com)</span> </address> </section> </div> <p class="" data-translation="true">Copyright © 아이뉴스24. 무단전재 및 재배포 금지.</p> 관련자료 이전 김수현, '스타덤 차트' 배우부문 12주연속 1위…김혜윤 2위, 차은우 3위 01-05 다음 안성기 별세에 침통한 연예계…배철수·윤종신·이시언 "잊지 않겠습니다" 추모 01-05 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.