“챗GPT 게섰거라” 통할까…국가대표 AI 평가 압도적 1위 한 LG

작성일 01-11

<div id="layerTranslateNotice" style="display:none;"></div>  <strong class="summary_view" data-translation="true">LG의 K-엑사원 성능에서 우위<br>‘누구나 이용’ SKT는 개방성 강점</strong> 
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="HekNobu5WP">
          <figure class="figure_frm origin_fig" contents-hash="7d7b9843fec11f96604406080a940883ed21abbbe6624d7bfce2a9702cd2cbf3" dmcf-pid="XdEjgK71l6" dmcf-ptype="figure">
           <p class="link_figure"><img alt="지난달 30일 열린 ‘독자 AI 모델 1차 발표회’에서 참관객들이 부스를 둘러보고 있다. 연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/11/mk/20260111233904920vypl.jpg" data-org-width="700" dmcf-mid="WVZNobu5TM" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/11/mk/20260111233904920vypl.jpg" width="658"></p>
           <figcaption class="txt_caption default_figure">
            지난달 30일 열린 ‘독자 AI 모델 1차 발표회’에서 참관객들이 부스를 둘러보고 있다. 연합뉴스
           </figcaption>
          </figure>
          <div contents-hash="0d86a1e2f17be4f7f2aff7a30a8735830140b64b24781d7352a06bc5bb214591" dmcf-pid="ZJDAa9ztS8" dmcf-ptype="general">
           국가대표 인공지능(AI) 모델 개발에 나선 5개 정예팀 중 1차 단계에서 가장 뛰어난 성능을 갖춘 모델은 LG AI연구원인 것으로 나타났다. 모델 개방성 측면에서는 SK텔레콤과 NC AI가 두드러졌다.
          </div>
          <p contents-hash="71f24c8410289ace699bad8a98b9416f61550801ff5bf9d1d7edf1278a965ebb" dmcf-pid="5iwcN2qFh4" dmcf-ptype="general">11일 각 기업이 기술 보고서를 통해 공개한 주요 벤치마크 테스트 결과에 따르면 LG AI연구원의 ‘K-엑사원(EXAONE)’이 다른 모델 대비 높은 점수를 기록했다.</p>
          <p contents-hash="5ee0af740d86127157e666fae2cd4d29fcf13a998f77f27b02bd939359915693" dmcf-pid="1nrkjVB3lf" dmcf-ptype="general">전문 분야 문제를 포함하는 고난도 한국어 벤치마크인 ‘KMMLU-Pro’에서는 SK텔레콤이 68.1점, LG AI연구원이 67.3점으로 각각 1위, 2위를 차지했고 네이버와 업스테이지가 근소한 차이로 뒤를 이었다.</p>
          <p contents-hash="a9131f2d7931982e3c965f62f9dceaab4031008e05bd453ecc038302c3fc3305" dmcf-pid="tLmEAfb0hV" dmcf-ptype="general">영어 중심의 다중 처리 능력과 종합 지식을 판단하는 ‘MMLU-Pro’ 테스트에서는 LG AI연구원이 83.8점을 기록했으며, SK텔레콤과 업스테이지가 각각 2위, 3위를 차지했다.</p>
          <figure class="figure_frm origin_fig" contents-hash="40d4a18ade72e3671873b4818d4cf0b1dcc6b3b4a3eee552ca5d13c9a9d33c14" dmcf-pid="FosDc4Kph2" dmcf-ptype="figure">
           <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/11/mk/20260111233906209qosj.jpg" data-org-width="300" dmcf-mid="YT5jgK71yx" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/11/mk/20260111233906209qosj.jpg" width="658"></p>
          </figure>
          <div contents-hash="beb93b539dbff2a0b2d8ed1cdc776f02415027ccf7b9943401dd2678a8babcab" dmcf-pid="3gOwk89UW9" dmcf-ptype="general">
           수학 능력을 평가하는 AIME 2025, 코딩 능력을 보는 라이브코드벤치(LiveCodeBench)에서도 LG AI연구원이 타 모델 대비 고득점을 기록했다. 해당 벤치마크 점수는 각 기업이 자체 진행한 테스트 결과로 직접적인 비교는 어렵지만, 전반적인 지표에서 LG AI연구원이 우위를 보인 것으로 풀이된다. LG AI연구원에 따르면 K-엑사원은 독자 AI 파운데이션 모델 프로젝트의 1차 평가 기준인 13개의 벤치마크 테스트 가운데 10개에서 1위를 차지했다. 전체 평균 점수도 72점을 기록해 5개 정예팀이 개발한 모델 중 가장 뛰어난 성능을 보였다. 이는 알리바바 ‘큐웬3 235B’와 오픈AI의 ‘GPT-OSS 120B’의 성능도 넘은 수준이다.
          </div>
          <p contents-hash="31c3955b3f626e42d0d860e36abb48f2321a1d15dd1b0b4268d9472297794c0a" dmcf-pid="0SFZGAoMhK" dmcf-ptype="general">네이버는 상대적으로 크기가 작은 경량화 모델이다 보니 주요 지표에서 다소 떨어진 것으로 추측된다. 업스테이지의 경우 법률·의료·금융 같은 특화 분야에서 강점을 보였다.</p>
          <p contents-hash="97b51daac355ef16cabd5d8fbd1edee01975ee60f1bcac8358f15468bbd9653f" dmcf-pid="pv35HcgRCb" dmcf-ptype="general">5개의 모델은 모두 오픈소스 플랫폼에 등록돼 다른 기업이 이를 내려받을 수 있는데, 제3자 활용이 얼마나 자유로운지 가늠할 수 있는 라이선스 정책은 서로 달랐다.</p>
          <figure class="figure_frm origin_fig" contents-hash="700764105a76b6f7bcf6d3e94a57aff510f3d12c265a33e80fa7d4cae55e8885" dmcf-pid="UT01XkaeTB" dmcf-ptype="figure">
           <p class="link_figure"><img alt="독자 AI 파운데이션 모델 프로젝트에 참여하고 있는 5개 컨소시엄이 1차 결과로 발표한 모델의 주요 벤치마크 성능을 비교한 표. 벤치마크 지표는 각 사가 개별 측정해 기재한 기술 보고서 및 오픈소스 플랫폼 허깅페이스 기준." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/11/mk/20260111233907520ymmw.png" data-org-width="700" dmcf-mid="GOXWvod8TQ" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/11/mk/20260111233907520ymmw.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            독자 AI 파운데이션 모델 프로젝트에 참여하고 있는 5개 컨소시엄이 1차 결과로 발표한 모델의 주요 벤치마크 성능을 비교한 표. 벤치마크 지표는 각 사가 개별 측정해 기재한 기술 보고서 및 오픈소스 플랫폼 허깅페이스 기준.
           </figcaption>
          </figure>
          <div contents-hash="9254ee797034ea6ea29f4e2fcceb2543e5059dfde0d97e3eedf81ccc1bbe118c" dmcf-pid="uyptZENdvq" dmcf-ptype="general">
           SK텔레콤과 NC AI는 각각 아파치 2.0과 MIT 라이선스를 적용했다. 둘 다 상업적 이용이 가능하고 모델을 자유롭게 수정해 배포할 수 있어 가장 제약이 적었다. 업스테이지 또한 아파치 2.0 기반 라이선스를 채택했지만, 자사 모델(솔라)을 기반으로 파생 모델을 만들 경우 명칭에 ‘솔라’를 반드시 표기하도록 하는 등 추가적인 조항이 따라붙는다.
          </div>
          <p contents-hash="33a7feaf042ec0f1afa59f7585ee8e19658f6bd23d2e4d094aba9ef0a90948d8" dmcf-pid="7WUF5DjJlz" dmcf-ptype="general">자체 라이선스를 적용한 네이버의 경우 상업적 이용은 허용하나 네이버의 서비스 영역과 겹치는 서비스의 경우 별도 협의를 거치도록 했으며, LG AI연구원은 연구 목적 중심의 활용만 가능하도록 했다.</p>
          <p contents-hash="4c5ee6dd9add584043c31eac4af4b19a202b09b2a0cdd7b1b577ea9b92d8f3c6" dmcf-pid="zYu31wAiW7" dmcf-ptype="general">정호준·이진한 기자</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 매일경제 &amp; mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지</p>

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

“챗GPT 게섰거라” 통할까…국가대표 AI 평가 압도적 1위 한 LG

멤버랭킹

관련자료

멤버랭킹