샘 올트먼 "실험적 추론 AI, 국제수학올림피아드서 금메달급 성과"

작성일 07-20

<div id="layerTranslateNotice" style="display:none;"></div> 기존 스케일링 한계극복 '테스트 타임연산 확장' 적용 주장 몇 시간짜리 문제푸는 천재급 AI 성큼…신중한 접근 지적도 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="WmeIqkHEZq">
 <figure class="figure_frm origin_fig" contents-hash="4e630653dc817da2078d693a807850df7a396a659f50395b2104fb6e70278192" dmcf-pid="YsdCBEXDtz" dmcf-ptype="figure">
 <img alt="샘 올트먼 오픈AI 최고경영자(CEO) X(옛 트위터) 갈무리" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/20/NEWS1/20250720174437264bzub.jpg" data-org-width="340" dmcf-mid="xi0Rlfj4Zb" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/20/NEWS1/20250720174437264bzub.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 샘 올트먼 오픈AI 최고경영자(CEO) X(옛 트위터) 갈무리
 </figcaption>
 </figure>
 (서울=뉴스1) 김민석 기자 = 챗GPT 개발사 오픈AI가 실험적 추론 인공지능(AI) 모델이 세계 최고 수준 수학 경시대회인 국제수학올림피아드(IMO)에서 금메달 수준의 성과를 거뒀다고 19일(현지시간) 밝혔다.
 샘 올트먼 오픈AI 최고경영자(CEO)는 X(옛 트위터)를 통해 "범용 추론 거대언어모델(LLM)로 2025년 IMO에서 금메달 수준의 성과를 달성했다"며 "10년간 AI가 얼마나 발전했는지를 보여주는 중요한 지표"라고 말했다.
 이어 "곧 GPT-5를 출시할 예정으로 정확한 기대치를 설정하고 싶다"며 "IMO 금메달 급의 실험적 모델은 수개월 내 출시할 계획이 없다"고 전했다. GPT-5가 IMO 금메달 급 수준의 기능을 갖추진 않을 것이란 설명이다.
 <figure class="figure_frm origin_fig" contents-hash="599d784401b70589d29d3d182855863eb261c6108c77152541f7fd73560b17bc" dmcf-pid="ZhLv2mts1p" dmcf-ptype="figure">
 <img alt="알렉산더 웨이 연구원은 범용 강화학습과 테스트 타임 연산 확장(추론 과정에서 더 많은 자원과 시간을 투입해 성능을 높이는 기술)을 적용한 추론 LLM이 국제 수학 올림피아드(IMO) 2025에서 금메달에 해당하는 성적을 거뒀다고 발표했다.(X 갈무리)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/20/NEWS1/20250720174438678rwvm.jpg" data-org-width="700" dmcf-mid="yGQrUNyj1B" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/20/NEWS1/20250720174438678rwvm.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 알렉산더 웨이 연구원은 범용 강화학습과 테스트 타임 연산 확장(추론 과정에서 더 많은 자원과 시간을 투입해 성능을 높이는 기술)을 적용한 추론 LLM이 국제 수학 올림피아드(IMO) 2025에서 금메달에 해당하는 성적을 거뒀다고 발표했다.(X 갈무리)
 </figcaption>
 </figure>
 IMO는 1959년부터 진행되고 있는 올림피아드로 매년 7월 전 세계 고등학생 수학 영재들이 실력을 겨룬다. 이틀 동안 하루 3문제씩 총 6문제가 출제되며 각 시험시간은 4시간 30분이다. 문제당 배점은 7점으로 42점 만점이다. 풀이 과정도 평가 대상이다.
 오픈AI 측은 실험적 추론 모델이 IMO와 동일 조건에서 추가 도구나 인터넷 활용 없이 5문제를 풀었다고 전했다. IMO 수상 경험을 가진 평가자 3명이 독립적으로 채점한 결과 총 35점을 획득했다고 회사 측은 전했다.
 알렉산더 웨이 연구원은 "범용 강화학습과 테스트 타임 연산 확장(추론 과정에서 더 많은 자원과 시간을 투입해 성능을 높이는 기술)이라는 새로운 길을 개척한 결과"라고 설명했다.
 구글 딥마인드의 수학 영역 특화 모델인 '알파 프루프(Alpha Proof)와 '알파지오메트리 2'(AlphaGeometry 2)가 지난해 IMO에서 은메달권 성적을 기록한 바 있다.
 이에 오픈AI의 실험적 범용 추론모델이 금메달 급 성능을 갖춘 것이 사실이라면, 인간 최고 수준 지성·지능에 LLM이 근접했다는 것을 보여주는 상징적인 사건이라는 평가가 나온다.
 일각에선 오픈AI가 내부 실험 결과만 발표하고 어떤 과정으로 금메달 수준을 달성했는지 설명하지 않은 만큼 신중하게 접근해야 한다는 반론도 제기되고 있다.
 AI 비평 전문가로 알려진 게리 마커스는 "실험적 모델이 기존 모델과 어떤 점이 다른지, 수학 외 영역에서의 실용성, 점수의 실제 유효성 등이 불투명하다"며 "성과의 의미를 판단하기는 이르다"고 평가했다.
 ideaed@news1.kr &lt;용어설명&gt; ■ LLM Large Language Model. 대규모 언어 모델. 자연어 처리(NLP) 작업을 수행할 수 있는 머신 러닝 모델을 말한다. 자연어의 복잡성을 이해할 수 있어 기존 기계 학습 알고리즘보다 정확하다. 
 </section> 
 </div> 
 Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

샘 올트먼 "실험적 추론 AI, 국제수학올림피아드서 금메달급 성과"

멤버랭킹

관련자료

멤버랭킹