AI에 프리미어리그 베팅 시켜봤더니…“대부분 파산” 작성일 04-12 9 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">“정해진 해법 없는 목표 장기 수행하기엔 부족”</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="7bYQwbsADY"> <figure class="figure_frm origin_fig" contents-hash="85a15706f031b0293821cd5b6c9c8a43d08c53385e5b4c080abe21333ff1bed8" dmcf-pid="zKGxrKOcEW" dmcf-ptype="figure"> <p class="link_figure"><img alt="제미나이가 그린 일러스트." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/12/dt/20260412163804360tnxg.png" data-org-width="640" dmcf-mid="uBEUeHiPIG" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/12/dt/20260412163804360tnxg.png" width="658"></p> <figcaption class="txt_caption default_figure"> 제미나이가 그린 일러스트. </figcaption> </figure> <p contents-hash="1bfe4102246c5bf4a7ef7f1258a17dae0e07a742fdaebaba483c7f22be77cce8" dmcf-pid="q9HMm9Iksy" dmcf-ptype="general"><br> 주요 인공지능(AI) 모델들이 잉글랜드 프리미어리그 축구 모의 베팅에서 모두 손실을 기록했다는 연구 결과가 나왔다.</p> <p contents-hash="67af7f607bcc382fc473f2086bc9a945cfe4df04f78180c54d9a57c712f42e6f" dmcf-pid="B2XRs2CEmT" dmcf-ptype="general">11일(현지시간) 영국 런던의 AI 스타트업 제너럴리즈닝이 공개한 ‘켈리벤치’ 논문에 따르면 2023∼2024 시즌 프리미어리그를 가상으로 재현해 8개 AI 모델에 베팅하도록 한 결과 이 같은 결과가 나왔다.</p> <p contents-hash="ac9fbc925fa7414453dd03a73522b92cb9928f8fdeabc25f518ee819a5ec5010" dmcf-pid="bVZeOVhDEv" dmcf-ptype="general">연구진은 오픈AI의 ‘GPT-5.4’, 앤트로픽의 ‘클로드 오퍼스4.6’, 구글의 ‘제미나이3.1 프로’, xAI의 ‘그록(Grok) 4.20’ 등을 비롯한 8개 모델에 각 10만 파운드를 초기 자금으로 지급하고 경기 결과와 득점수에 베팅하도록 했다.</p> <p contents-hash="37ec8785651e0733ad7aa171b98e25d8f286e23cb7661f5b8faa57286f78081a" dmcf-pid="KFOboFNdES" dmcf-ptype="general">AI 모델들에게는 약 30년 치의 과거 경기 데이터가 제공됐으나, 인터넷 접속은 차단돼 ‘커닝’은 할 수 없도록 했다.</p> <p contents-hash="2b2db230b8ce59dc1ed251ac27e01753a2a10fdbba8db74d0baa51db3990e79e" dmcf-pid="93IKg3jJEl" dmcf-ptype="general">조사 대상 모델 가운데 3차례 시도에서 모두 파산을 면한 것은 클로드 오퍼스 4.6(-11%)과 GPT-5.4(-13.6%) 둘 뿐이었다.</p> <p contents-hash="a84e2a353d8cd11365954b834010be9d1b60c5c125a7f6d81cb19ccc09392ba0" dmcf-pid="20C9a0AiOh" dmcf-ptype="general">연구팀은 이들 두 모델에 대해 “새로운 경기 데이터에 대응해 전략을 재조정하고, 베팅을 임의로 하지 않고 체계적으로 시행했으며, 전략상 우위가 없는 상황에서도 자본을 보존했다”고 평가했다.</p> <p contents-hash="df5bb5646bf3c3c864fa95b141bda3381f8ff077d4af66c3ec297374eab22e9e" dmcf-pid="Vph2NpcnDC" dmcf-ptype="general">반면 나머지 6개 모델은 3차례 중 적어도 한 번은 초기 자금을 모두 잃거나 베팅 자체를 완수하지 못해 기권 처리됐다.</p> <p contents-hash="4960abda98a4b57fd27d11493ac02f361d677f12fa7ce0b8d98f77a1156c981e" dmcf-pid="fUlVjUkLsI" dmcf-ptype="general">또 추론 과정에서 유망한 전략을 제시하고도 그에 따라 제대로 행동하지는 못하는 ‘지식-행동 격차’를 보이기도 했다.</p> <p contents-hash="4a6f3033f655a74c19e2d767632dc8e2a026d7f0eb19a37b7d3c5bb8ab811be3" dmcf-pid="4uSfAuEoEO" dmcf-ptype="general">연구진은 스포츠 베팅 전문가들에 자문해 각 모델의 전략 ‘정교도’를 평가했는데, 1∼2위 모델인 클로드 오퍼스4.6(32.6%)과 GPT-5.4(31.8%)조차 만점의 3분의 1 수준에도 미달했다.</p> <p contents-hash="425a0e73a486ebfd0f2989168b9f14bce59d1cc0094f3b4050d72d1256e4c1b6" dmcf-pid="87v4c7Dgws" dmcf-ptype="general">제미나이3.1 프로와 그록4.20은 각 9.8%에 그쳐 훨씬 더 낮은 평가를 받았다.</p> <p contents-hash="0fb7b780123ea0ca05b38a7ec8e85b3695beb4f6dab04f7b7951729cb41ac812" dmcf-pid="6zT8kzwaEm" dmcf-ptype="general">연구진은 “AI 모델은 정교한 코드를 작성하고 스스로 실패를 진단하며 제대로 된 전략을 표현할 수는 있다”면서도 “정작 그 전략을 안정적으로 실행하거나 자신의 성과를 모니터링하고 접근법이 작동하지 않을 때 조정하는 데는 실패를 반복한다”고 지적했다.</p> <p contents-hash="87612edffafa0de941d8a6a28afea90d7f64f29d6f5514b950a8ee997d8c4067" dmcf-pid="Pqy6EqrNOr" dmcf-ptype="general">이와 같은 결과는 현재의 AI 모델이 코드의 버그를 수정하는 것처럼 목표와 기준이 명확한 과제는 잘 해결하지만, ‘수익을 극대화하라’와 같이 정해진 해법이 없는 목표를 장기 수행하는 데는 부족하다는 사실을 보여준다고 연구진은 결론을 내렸다.</p> <p contents-hash="b7767c0a89c8f0ccefd469e02f2cfa6d5a9a901c73eb30b985c0d06e53a9e18c" dmcf-pid="QBWPDBmjIw" dmcf-ptype="general">김남석 기자 kns@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p> 관련자료 이전 ‘혈전 끝 한 달 만에 빚 갚았다’ 안세영, 생애 첫 아시아선수권 우승… 마지막 퍼즐 조각까지 채웠다 04-12 다음 '전국노래자랑' 유민, '야 좋냐'로 폭발한 귀공자 보이스 04-12 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.