첨단 AI 모델들이 프리미어리그 경기에 베팅했더니···“모두 손실” 작성일 04-12 32 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="5eoJn1gRyU"> <figure class="figure_frm origin_fig" contents-hash="42f163c23c5373d049a9ff70de823a5258d1fdb76d519e3442e8b4657b06ace7" dmcf-pid="1dgiLtaeTp" dmcf-ptype="figure"> <p class="link_figure"><img alt="AP연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/12/khan/20260412160302899wpjt.jpg" data-org-width="1200" dmcf-mid="ZfAgNpcnvu" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/12/khan/20260412160302899wpjt.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> AP연합뉴스 </figcaption> </figure> <p contents-hash="cac6dcd3a9dcf2849e2893513fc961b364e662176910c1ee9f4652574ccad4de" dmcf-pid="tJanoFNdl0" dmcf-ptype="general">주요 첨단 인공지능(AI) 모델들이 잉글랜드 프리미어리그 한 시즌을 재현한 가상 베팅 실험에서 모두 손실을 기록했다는 연구 결과가 나왔다.</p> <p contents-hash="4d564b21523109fd3aed69c949dc91f19249d057871599eab453025293774232" dmcf-pid="FiNLg3jJC3" dmcf-ptype="general">12일 업계에 따르면 영국의 AI 스타트업 제너럴리즈닝은 최근 2023~2024시즌 프리미어리그를 가상으로 재현한 환경에서 8개 주요 AI 시스템을 테스트한 결과를 담은 ‘켈리벤치’ 논문을 공개했다. 대상 모델은 오픈AI의 GPT-5.4, 앤트로픽의 클로드 오퍼스 4.6, 구글의 제미나이 3.1 프로, xAI의 그록 4.20 등이다.</p> <p contents-hash="af1c5bda2206a97d0d5cf60f8e5fa3953a6d7e3c20d941990cb5c4a5046431e1" dmcf-pid="3njoa0AiTF" dmcf-ptype="general">연구진은 각 AI에게 과거 경기와 선수 등에 상세한 데이터를 제공한 뒤 수익을 극대화하고 위험을 관리하는 모델을 구축하도록 지시했다. 이후 매 경기일마다 최소 한 건 이상 경기 결과, 득점 등 유형을 선택해 베팅하도록 했다. AI가 미리 경기 결과에 접근할 수 없도록 인터넷 접속은 차단했다. 경기 후에는 결과와 선수별 상세 통계를 제공해 모델 개선에 활용할 수 있도록 했다. 테스트는 모델별로 세 차례씩 진행됐고, 매 시도마다 초기 자본금 10만파운드가 주어졌다.</p> <p contents-hash="bf2c70b69f2b306e869636df0ef2b0a9fd50d1ea1e7500f7e2147b27de49a504" dmcf-pid="0gkNAuEoht" dmcf-ptype="general">클로드 오퍼스 4.6이 가장 나은 성과를 보였지만, 평균 수익률은 마이너스(-11%)를 기록했다. 클로드의 세 차례 시도 중 가장 나은 결과도 −0.2%에 그쳤다. 파산을 면한 건 클로드 오퍼스 4.6과 GPT-5.4(평균 수익률 −13.6%) 둘 뿐이었다.</p> <p contents-hash="bc0b98f2a0da13bd742eb893e8e804a81ad8a3343499dc3c92f79080e6825674" dmcf-pid="paEjc7Dgy1" dmcf-ptype="general">다른 모델들은 적어도 한 번은 초기 자금을 모두 잃거나 베팅 자체를 완수하지 못했다. 평균 수익률 -43.3%을 기록한 제미나이 3.1 프로는 한 차례 34% 수익을 냈지만, 다른 시도에서 파산을 경험했다. 그록 4.20은 한 번 파산했고, 나머지 두 번의 시도는 완료하지 못했다.</p> <p contents-hash="c92bf898b398c354fa69612a17c305358084a3eadb60532ade6d37560495c3eb" dmcf-pid="UNDAkzway5" dmcf-ptype="general">연구진은 AI가 목표가 명확한 절차적 작업에는 뛰어난 능력을 보이지만, 현실처럼 계속 변하고 정답이 없는 환경에서의 성능은 제대로 검증되지 않고 있다며 연구 배경을 설명했다. 연구진은 “이번 연구의 여러 한계점에도 불구하고 현재 AI 모델들은 전반적으로 인간보다 저조한 성과를 보이고 있다”고 말했다. 운동선수가 장기 부상 이후 기량이 달라지듯, 시간이 지나며 환경이 계속 변하는 상황에서는 AI가 대응하는 데 한계를 보인다는 것이다. 다만 이번 논문은 아직 동료 평가를 거치지 않은 상태다.</p> <p contents-hash="69f9294e9af2664e1ef3b79942439937395a8a1f554d8e5543e4a6f5b6b27f5e" dmcf-pid="ujwcEqrNhZ" dmcf-ptype="general">로스 테일러 제너럴리즈닝 최고경영자(CEO)는 파이낸셜타임스에 “AI 자동화에 대한 기대가 크지만, 장기적인 환경에서 AI를 평가하는 시도는 많지 않다”며 현실세계의 복잡성을 반영한 평가가 필요하다고 강조했다.</p> <p contents-hash="834122f6e922a8b0c2dc9cb323d3a506dddfc4a90027d37615be647351604788" dmcf-pid="7ArkDBmjlX" dmcf-ptype="general">노도현 기자 hyunee@kyunghyang.com</p> </section> </div> <p class="" data-translation="true">Copyright © 경향신문. 무단전재 및 재배포 금지.</p> 관련자료 이전 5G SA 수익화 시동건 해외 통신사…국내도 부가옵션 상품화 검토 04-12 다음 AI 학습 필수재 '합성 데이터' 시장 뜬다…연평균 35% 성장 04-12 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.