'국대 AI' LG AI 연구원 압도적 1위…SKT, 수학·장문이해 우수 작성일 01-15 34 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">LG AI 연구원, 종합 평가서 총 90.2점으로 최고점 기록<br>업스테이지, 글로벌 벤치마크 만점</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="3v0h72qFXI"> <figure class="figure_frm origin_fig" contents-hash="e46b334d7de7b95ddd333b3d65aac72f4ae7a275947d7c0b9914e36aede30601" dmcf-pid="0TplzVB31O" dmcf-ptype="figure"> <p class="link_figure"><img alt="배경훈 부총리 겸 과학기술정보통신부 장관이 12월 30일 오후 서울 강남구 코엑스 오디토리움에서 열린 '독자 AI파운데이션 프로젝트' 발표회에서 환영사를 하고 있다. 2025.12.30/뉴스1 ⓒ News1 구윤성 기자" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/15/NEWS1/20260115154915985aogx.jpg" data-org-width="1400" dmcf-mid="F5hoTZWIZC" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/15/NEWS1/20260115154915985aogx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 배경훈 부총리 겸 과학기술정보통신부 장관이 12월 30일 오후 서울 강남구 코엑스 오디토리움에서 열린 '독자 AI파운데이션 프로젝트' 발표회에서 환영사를 하고 있다. 2025.12.30/뉴스1 ⓒ News1 구윤성 기자 </figcaption> </figure> <p contents-hash="46c1d186b79887d58eca5c473f38eb2d83eb1529a199f1394c661e9f59a3db94" dmcf-pid="pyUSqfb0Hs" dmcf-ptype="general">(서울=뉴스1) 이기범 기자 = 국가대표 인공지능(AI)을 선발하는 첫 정부 평가에서 LG AI 연구원이 1등 기업으로 꼽혔다. AI 모델 성능을 측정하는 벤치마크를 비롯해 전문가 및 사용자 평가에서 LG AI 연구원은 모두 최고점을 받았다. SK텔레콤은 수학·지식·장문이해 등에서 높은 점수를 받았으며, 업스테이지는 글로벌 벤치마크 평가에서 우수한 평가를 받았다.</p> <p contents-hash="ecec11dc3ebf0ed8200b7ee024a0b3ed339f1b71595778393150b395652474c9" dmcf-pid="UWuvB4KpXm" dmcf-ptype="general">과학기술정보통신부, 정보통신산업진흥원(NIPA), 한국정보통신기술협회(TTA)는 15일 '독자 AI 파운데이션 모델' 프로젝트 1차 평가 결과를 발표했다. 평가 대상은 △네이버클라우드 △업스테이지 △SK텔레콤 △NC AI △LG AI 연구원 등 5개 정예팀이다.</p> <p contents-hash="5eb9bcd0fdba1ae7bb1305102e61d91d76aaa9b4d4e20130e14ee5e96e5793a3" dmcf-pid="uY7Tb89Utr" dmcf-ptype="general">이번 1차 단계 평가는 벤치마크, 전문가, 사용자 평가를 진행해 △AI 모델 성능과 실제 현장에서의 활용 가능성, 모델 크기 등 비용 효율성, 국내외 AI 생태계 파급효과 등을 포함한 △사용성·파급효과 등을 종합 평가했다.</p> <p contents-hash="b97eff38c4a912489a034b0c99e2ae55772b3587eac4f744a2f9036b9d83a8c3" dmcf-pid="7oOilGvmtw" dmcf-ptype="general">평가 결과 LG AI 연구원은 총 90.2점으로 가장 우수한 평가를 받았다. 5개 정예팀 평균은 79.7점이었다.</p> <p contents-hash="05a61c00c6e3b7c4a44058d57a775b5d000f2df12787e51b678ab44d0d6bce49" dmcf-pid="zgInSHTsHD" dmcf-ptype="general">세부 평가 내용을 살펴보면 벤치마크 평가는 △NIA 벤치마크 평가(10점) △글로벌 공통 벤치마크 평가(20점) △글로벌 개별 벤치마크 평가(10점) 등으로 진행됐다.</p> <p contents-hash="f3798abd99cf4b6a2a511bde8054051d21405470f45c1be45510c7e110dcdb56" dmcf-pid="qaCLvXyOHE" dmcf-ptype="general">수학, 지식, 장문이해, 신뢰성·안정성 분야 평가로 이뤄진 NIA 벤치마크 평가에서는 SK텔레콤과 LG AI 연구원이 10점 만점 중 9.2점으로 최고점을 받았다.</p> <p contents-hash="e07add5ed1523678e582ae6b159613f253df0b9965c36baad73f23b9fbb29cb7" dmcf-pid="BNhoTZWIHk" dmcf-ptype="general">수학, 지식·추론 등 세계적으로 인정되는 벤치마크 13종을 토대로 진행된 글로벌 공통 벤치마크 평가에서는 LG AI연구원이 20점 만점 중 14.4점으로 가장 높은 점수를 받았다.</p> <p contents-hash="95d09a12c50d767d04cedc08c5b0d3b79b357f5b2952019a82c4e04233a0c490" dmcf-pid="bjlgy5YCYc" dmcf-ptype="general">정예팀별로 글로벌 타깃 모델과 비교 가능한 벤치마크 5종을 선정해 평가가 진행된 글로벌 개별 벤치마크 평가에서는 업스테이지와 LG AI연구원이 10점 만점을 받았다.</p> <p contents-hash="016117faeab4ca43e08f0063ca8407ccbcd95d2c03b42ee5388621ddfeb0e659" dmcf-pid="KASaW1Gh5A" dmcf-ptype="general">벤치마크 평가를 종합한 결과 LG AI 연구원이 총 33.6점으로 가장 높은 점수를 기록했으며, 평균은 30.4점이었다.</p> <p contents-hash="45296c9c0755fa16f0c482c9e4f4102158cc37db856563261e5e38edd8699082" dmcf-pid="9cvNYtHlYj" dmcf-ptype="general">전문가 평가는 총 10명의 산학연 외부 AI 전문가로 구성된 평가위원회를 통해 이뤄졌다. 평가위원회는 5개 정예팀이 공개한 모델별 테크니컬 리포트, AI 모델 훈련 상태 로그 파일 등을 분석해 기술 개발 과정과 기술력을 평가했다.</p> <p contents-hash="56f194bccd874772da3d48f1a0889bd5ed3cbe9cf87d31225323fc52796da452" dmcf-pid="2kTjGFXStN" dmcf-ptype="general">그 결과 LG AI 연구원이 35점 만점 중 31.6점으로 가장 높은 점수를 받았다. 평균은 28.56점이었다.</p> <p contents-hash="4a8cd5e27ea05b282d2fec03b519194a78edf42d90d019c671f237f08b9c748d" dmcf-pid="VEyAH3ZvXa" dmcf-ptype="general">사용자 평가는 AI 스타트업 대표 등 49명의 AI 전문 사용자가 참여했다. 실제 현장 활용 가능성, 추론 비용 효율성 등을 분석했다. 사용자 평가 점수는 LG AI 연구원이 25점 만점을 받았다. 평균 점수는 20.76점이었다.</p> <p contents-hash="61cee2415a9cfb8e30aef52883722231b466107ec1cd60adcdc9693622388f64" dmcf-pid="fDWcX05Ttg" dmcf-ptype="general">한편 1차 평가에서 탈락팀은 네이버클라우드와 NC AI로 선정됐다. 네이버클라우드의 경우 벤치마크, 전문가 및 사용자 평가에서는 좋은 점수를 받았으나 논란이 됐던 독자성 부문이 탈락 요인이 됐다. </p> <p contents-hash="a74ad650b7e6410c0474920331143c3e6a1702bfcebb0564822388e04381acd1" dmcf-pid="4wYkZp1yGo" dmcf-ptype="general">정부는 이번 탈락팀을 포함해 최초 공모에 접수한 컨소시엄, 그 외 역량 있는 기업 모두에게 추가 기회를 제공해 1개 정예팀을 추가 선정할 계획이다.</p> <p contents-hash="dfe15a715dd216c7ffbc4d2532b72d7513ace7800ea02f6d30fc4a6f4089c728" dmcf-pid="8jlgy5YCYL" dmcf-ptype="general">Ktiger@news1.kr </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.</p> 관련자료 이전 올데프 애니, 재벌美 풍기는 첫 단독 커버…“스스로 만족 못해”[화보] 01-15 다음 [개인정보 다이어트 ①] “비번 돌려막다 다 털린다”... 새해 첫 보안 미션 01-15 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.