샘 올트먼 "실험적 추론 AI, 국제수학올림피아드서 금메달급 성과" 작성일 07-20 27 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">기존 스케일링 한계극복 '테스트 타임연산 확장' 적용 주장<br>몇 시간짜리 문제푸는 천재급 AI 성큼…신중한 접근 지적도</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="WmeIqkHEZq"> <figure class="figure_frm origin_fig" contents-hash="4e630653dc817da2078d693a807850df7a396a659f50395b2104fb6e70278192" dmcf-pid="YsdCBEXDtz" dmcf-ptype="figure"> <p class="link_figure"><img alt="샘 올트먼 오픈AI 최고경영자(CEO) X(옛 트위터) 갈무리" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/20/NEWS1/20250720174437264bzub.jpg" data-org-width="340" dmcf-mid="xi0Rlfj4Zb" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/20/NEWS1/20250720174437264bzub.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 샘 올트먼 오픈AI 최고경영자(CEO) X(옛 트위터) 갈무리 </figcaption> </figure> <p contents-hash="f084fb7d6b99f7e6b46240305755eea823595ad8552a1e447cf778987a3d6902" dmcf-pid="GOJhbDZw57" dmcf-ptype="general">(서울=뉴스1) 김민석 기자 = 챗GPT 개발사 오픈AI가 실험적 추론 인공지능(AI) 모델이 세계 최고 수준 수학 경시대회인 국제수학올림피아드(IMO)에서 금메달 수준의 성과를 거뒀다고 19일(현지시간) 밝혔다.</p> <p contents-hash="2033717732b1426d7fcb817b53de2614854042a580f44510ad83fe75f582f09b" dmcf-pid="HIilKw5r5u" dmcf-ptype="general">샘 올트먼 오픈AI 최고경영자(CEO)는 X(옛 트위터)를 통해 "범용 추론 거대언어모델(LLM)로 2025년 IMO에서 금메달 수준의 성과를 달성했다"며 "10년간 AI가 얼마나 발전했는지를 보여주는 중요한 지표"라고 말했다.</p> <p contents-hash="946f7d0d47dc865f85f877373e99a082a9af084c117a70622f687213f94ea056" dmcf-pid="XCnS9r1mZU" dmcf-ptype="general">이어 "곧 GPT-5를 출시할 예정으로 정확한 기대치를 설정하고 싶다"며 "IMO 금메달 급의 실험적 모델은 수개월 내 출시할 계획이 없다"고 전했다. GPT-5가 IMO 금메달 급 수준의 기능을 갖추진 않을 것이란 설명이다.</p> <figure class="figure_frm origin_fig" contents-hash="599d784401b70589d29d3d182855863eb261c6108c77152541f7fd73560b17bc" dmcf-pid="ZhLv2mts1p" dmcf-ptype="figure"> <p class="link_figure"><img alt="알렉산더 웨이 연구원은 범용 강화학습과 테스트 타임 연산 확장(추론 과정에서 더 많은 자원과 시간을 투입해 성능을 높이는 기술)을 적용한 추론 LLM이 국제 수학 올림피아드(IMO) 2025에서 금메달에 해당하는 성적을 거뒀다고 발표했다.(X 갈무리)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/20/NEWS1/20250720174438678rwvm.jpg" data-org-width="700" dmcf-mid="yGQrUNyj1B" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/20/NEWS1/20250720174438678rwvm.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 알렉산더 웨이 연구원은 범용 강화학습과 테스트 타임 연산 확장(추론 과정에서 더 많은 자원과 시간을 투입해 성능을 높이는 기술)을 적용한 추론 LLM이 국제 수학 올림피아드(IMO) 2025에서 금메달에 해당하는 성적을 거뒀다고 발표했다.(X 갈무리) </figcaption> </figure> <p contents-hash="d0038eb14c80cd044b748feb22610b07a1ac725c1053f1cb18716559d911cedf" dmcf-pid="5Ulzat6FY0" dmcf-ptype="general">IMO는 1959년부터 진행되고 있는 올림피아드로 매년 7월 전 세계 고등학생 수학 영재들이 실력을 겨룬다. 이틀 동안 하루 3문제씩 총 6문제가 출제되며 각 시험시간은 4시간 30분이다. 문제당 배점은 7점으로 42점 만점이다. 풀이 과정도 평가 대상이다.</p> <p contents-hash="1391c714b3d48cc965921861fe7e9887b7fadc87fe09889e42b5c89fbcc46c7c" dmcf-pid="1uSqNFP3Z3" dmcf-ptype="general">오픈AI 측은 실험적 추론 모델이 IMO와 동일 조건에서 추가 도구나 인터넷 활용 없이 5문제를 풀었다고 전했다. IMO 수상 경험을 가진 평가자 3명이 독립적으로 채점한 결과 총 35점을 획득했다고 회사 측은 전했다.</p> <p contents-hash="6287df0bf5366036ccff3aa38622fcfafd27f36ea10210d8f716f5342a2dc9b7" dmcf-pid="t7vBj3Q0YF" dmcf-ptype="general">알렉산더 웨이 연구원은 "범용 강화학습과 테스트 타임 연산 확장(추론 과정에서 더 많은 자원과 시간을 투입해 성능을 높이는 기술)이라는 새로운 길을 개척한 결과"라고 설명했다.</p> <p contents-hash="9d9523de2f07566c78bcc04b86c22fa7d918ddb16259f53c309d64c64fb1a2ca" dmcf-pid="FzTbA0xpYt" dmcf-ptype="general">구글 딥마인드의 수학 영역 특화 모델인 '알파 프루프(Alpha Proof)와 '알파지오메트리 2'(AlphaGeometry 2)가 지난해 IMO에서 은메달권 성적을 기록한 바 있다.</p> <p contents-hash="8bc31186d9c7be33e050a2fbcd6fe1c8dc0f51ceb602e42607ed18ba03774c63" dmcf-pid="3qyKcpMU11" dmcf-ptype="general">이에 오픈AI의 실험적 범용 추론모델이 금메달 급 성능을 갖춘 것이 사실이라면, 인간 최고 수준 지성·지능에 LLM이 근접했다는 것을 보여주는 상징적인 사건이라는 평가가 나온다.</p> <p contents-hash="d2f6e2d13c7656040ec3de031b37b3b24129ae7e5c8872f73e69da8e4ffb1160" dmcf-pid="0BW9kURu55" dmcf-ptype="general">일각에선 오픈AI가 내부 실험 결과만 발표하고 어떤 과정으로 금메달 수준을 달성했는지 설명하지 않은 만큼 신중하게 접근해야 한다는 반론도 제기되고 있다.</p> <p contents-hash="cbfc655338c5bad9d2d521b68ecce7dbf5b3b7dd6f56b377459fbfc14413d666" dmcf-pid="pbY2Eue7GZ" dmcf-ptype="general">AI 비평 전문가로 알려진 게리 마커스는 "실험적 모델이 기존 모델과 어떤 점이 다른지, 수학 외 영역에서의 실용성, 점수의 실제 유효성 등이 불투명하다"며 "성과의 의미를 판단하기는 이르다"고 평가했다.</p> <p contents-hash="cc329ce3bf3e3c8ca16abafda42fa6d47e2e6d78e818c5a236888d6ff535c092" dmcf-pid="UKGVD7dzXX" dmcf-ptype="general">ideaed@news1.kr<br><br><strong><용어설명></strong><br><br>■ LLM<br>Large Language Model. 대규모 언어 모델. 자연어 처리(NLP) 작업을 수행할 수 있는 머신 러닝 모델을 말한다. 자연어의 복잡성을 이해할 수 있어 기존 기계 학습 알고리즘보다 정확하다.<br><br> </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.</p> 관련자료 이전 “회당 출연료 5억, 그냥 소문인 줄 알았더니” 결국 싹쓸이 넷플릭스→이쯤되면 ‘한플릭스’ 07-20 다음 ‘라스트 댄스’ 포이리에 향한 맥그리거의 마지막 공격 “R.I.Pea head!”…‘옥타곤 복귀’ 존스도 찬사 보내 [UFC] 07-20 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.