AI가 수능 풀어보니… 제미나이는 92점, 한국 모델은 20점대 작성일 12-16 29 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="5VA0bk9UGG"> <p contents-hash="43cd59075563c53429a49dc49d435ac585a78c3ac2c2a731dc8f507122b74a34" dmcf-pid="1fcpKE2utY" dmcf-ptype="general">‘국가대표 AI(인공지능)’ 개발을 진행 중인 국내 업체들의 대형 언어 모델(LLM)이 오픈AI·구글의 AI 모델과 비교해 성능이 크게 떨어지는 것으로 나타났다.</p> <p contents-hash="eaadf62cafb346c8796302772aabe5f4588dad90948e65e04bb42523363bd4f6" dmcf-pid="t4kU9DV71W" dmcf-ptype="general">15일 김종락 서강대 수학과 교수 연구팀은 국내 국가대표 AI 모델(소버린AI) 개발에 도전한 5개 팀과 챗GPT 등 해외 5개 모델의 주요 LLM에 수능 수학 20문제와 논술 10문제 등 총 50문제를 풀게 했다. 수학 문제 중 공통 과목, 확률과 통계, 미적분, 기하 분야에서 가장 어려운 문항 5개씩 총 20문제를 뽑았다. 또 국내 10개 대학 논술 기출 문제와 인도 대학입시 10문제, 일본 도쿄대 공대 대학원 입시 수학 10문제 등 총 50개 문제를 뽑아 10개 모델에 풀게 했다.</p> <p contents-hash="5e9fc641254abb2fc2e09071014e5c55757d92495d752e8b8652b582f5fa0927" dmcf-pid="F8Eu2wfzYy" dmcf-ptype="general">한국 모델로는 업스테이지의 ‘솔라 프로-2’, LG AI연구원의 ‘엑사원 4.0.1’, 네이버의 ‘HCX-007’, SK텔레콤의 ‘A.X 4.0(72B)’, 엔씨소프트의 ‘라마 바르코 8B 인스트럭트’ 등 5개가, 해외 모델로는 오픈AI의 GPT-5.1, 구글의 제미나이 3 프로 프리뷰, 앤스로픽의 클로드 오퍼스 4.5, xAI의 그록 4.1 패스트, 중국의 딥시크 V3.2 등 5개 모델이 조사에 활용됐다.</p> <p contents-hash="71e9ba51f2d6e0d3183c22aa395fa10276c597a346284fa5e43ea1f1d71aada0" dmcf-pid="36D7Vr4q1T" dmcf-ptype="general">결과는 해외 모델의 압승이었다. 구글 제미나이 3프로는 92점, 앤트로픽의 클로드 오퍼스4.5는 84점을 받는 등 해외 모델은 76~92점을 받았다. 반면 한국 모델은 업스테이지의 ‘솔라 프로-2’만 58점을 받았고 나머지는 20점대에 머물렀다. 엔씨소프트의 ‘라마 바르코 8B 인스트럭트’는 2점을 받았다. 연구팀은 한국 모델이 단순 추론 기능으로는 문제를 잘 해결하지 못해 일종의 인센티브를 줬는데도 해외 모델과 성능 격차가 컸다고 설명했다. 연구팀은 또 다양한 난이도로 만든 자체 문제 100개 중 10개를 골라 추가 실험을 진행했는데, 비슷한 결과를 얻었다고 밝혔다.</p> <p contents-hash="3b143778e058742d2d3ac837b132c33e0d993a58c30e81d5339274dc82680c9e" dmcf-pid="0Pwzfm8B1v" dmcf-ptype="general">테크 업계 일각에선 이 실험 결과가 ‘비효율적인 소버린 AI 구축’을 나타내는 사례라고 본다. 테크 업계 관계자는 “자체 AI 구축이 안보 측면에서 중요하다고 하더라도 해외 다른 AI와 비교해 성능이 떨어지면 굳이 개발할 필요가 있겠느냐”며 “무작정 국가대표 AI를 개발하는 것보다 다양한 AI 활용 전략을 고심해야 한다”고 했다.</p> </section> </div> <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p> 관련자료 이전 스포츠토토 ‘스포츠드림데이’ 다문화 아동에 스포츠 경험 선물 12-16 다음 해킹 당한 KT, 보안 공공사업 무더기 수주 12-16 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.