GPT 5.2 vs 제미나이 3 성능 격차는… 구글 반격에 막 오른 AI 패권 경쟁

작성일 12-15

<div id="layerTranslateNotice" style="display:none;"></div> GPT-5.2 조기 출시에도 판도 못 뒤집어 벤치마크 점수는 박빙, 향후 승부처는 AI 생태계 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="5UwzWYLxov">
 <figure class="figure_frm origin_fig" contents-hash="ae2f23ca2a755bc8964379d1d177fe55cdffa1910855fad02b056a3eb638a26e" dmcf-pid="1urqYGoMkS" dmcf-ptype="figure">
 <img alt="그래픽=손민균" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/15/chosunbiz/20251215175147514fwgz.jpg" data-org-width="640" dmcf-mid="H1PCog71aW" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/15/chosunbiz/20251215175147514fwgz.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 그래픽=손민균
 </figcaption>
 </figure>
 챗GPT 개발사 오픈AI가 독주하던 생성형 인공지능(AI) 시장에 지각변동이 일어나고 있다. 구글이 지난달 출시한 최신 AI 모델 ‘제미나이 3’가 대폭 개선된 성능으로 챗GPT를 맹추격하면서 AI 시장 선두 자리를 놓고 구글과 오픈AI가 치열하게 경쟁하는 ‘2강 체제’로 접어들었다는 분석이 나온다. 오픈AI는 제미나이의 약진에 대응해 ‘중대경보(코드 레드)’를 발동하고 GPT-5.2를 예정보다 앞당겨 출시했지만, 최신 모델의 성능이 제미나이를 압도할 만한 수준은 아니어서 선두 자리를 굳히기엔 역부족이라는 평가를 받는다.
 AI 업계에서는 양사가 앞으로도 최신 AI 모델을 앞다퉈 출시하고, 대규모 투자와 인프라 계약을 발표하는 등 AI 생태계 주도권을 선점하기 위해 정면 승부를 벌일 것으로 전망하고 있다.
 ◇ 코드 레드 발동에도 GPT-5.2와 제미나이 3 성능 차이 없어
 15일 기준 AI 모델 성능을 평가하는 주요 벤치마크와 실사용 지표에 따르면 GPT-5.2와 제미나이 3의 성능은 비등한 수준이다. 이용자가 직접 AI 모델의 성능을 평가해 순위를 매기는 ‘LM아레나 리더보드’에서 제미나이 3는 텍스트, 비전, 이미지 편집, 검색 등을 아우르는 종합적 평가에서 1위를 기록 중이다. GPT-5.2는 아직 출시 초기라 LM아레나의 일부 지표에서만 성적이 확인되는 상태다. 구체적으로 GPT-5.2는 LM아레나의 웹 개발(WebDev) 지표에서 앤트로픽의 ‘클로드 오퍼스 4.5 씽킹’에 이어 2위에 이름을 올렸다. 제미나이 3는 해당 지표에서 4위를 기록했다. 다만 텍스트, 비전, 텍스트-이미지 변환, 이미진 편집, 검색 등의 세부 지표에서는 제미나이 3가 1위를 석권했다.
 <figure class="figure_frm origin_fig" contents-hash="25018936a706b62fbf1ea5d8b6830a3e32ccb85e3000ab1ff65bb1e9564096a1" dmcf-pid="pbC251AiaO" dmcf-ptype="figure">
 <img alt="그래픽=손민균" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/15/chosunbiz/20251215175148782cnxa.jpg" data-org-width="640" dmcf-mid="XZQSNjB3ay" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/15/chosunbiz/20251215175148782cnxa.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 그래픽=손민균
 </figcaption>
 </figure>
 IT매체 매셔블은 “GPT-5.2가 아직 LM아레나 전체 순위가 반영되기 전이라 추후 성과를 지켜봐야 하겠지만, 현재까지 두 모델은 벤치마크 성능, 가격 등 주요 지표에서 차이가 거의 없고 각각 특정 영역에서만 경쟁 우위를 보이고 있다”고 전했다.
 다른 벤치마크에서도 GPT-5.2와 제미나이 3는 대동소이한 성능을 보였다. 코딩을 포함한 소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 GPT-5.2가 80%로 제미나이 3 프로의 76.2%를 넘어섰고, ‘인간의 마지막 시험’으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서는 도구를 사용할 경우 50%의 정답률로 제미나이 3 프로의 45.8%를 능가했다. 다만 HLE에서 도구를 사용하지 않을 경우 GPT-5.2의 정답률은 34.5%로 제미나이의 37.5%에 못 미쳤다.
 과학적 문제 해결력을 측정하는 GPQA 다이아몬드 벤치마크에서는 GPT-5.2가 92.4%로 제미나이 3를 91.9% 소폭 앞선 반면, 다국어 이해 능력과 고급 추론 능력을 평가하는 MMMLU 벤치마크에서는 제미나이 3(91.8%)가 GPT-5.2(89.6%)보다 점수가 높았다. 이밖에 AIME 2025(미국 수학경시) 벤치마크에서는 도구 미사용 기준으로 GPT 5.2(100%)가 제미나이 3(95%) 대비 우위를 보였다.
 <figure class="figure_frm origin_fig" contents-hash="c2026633f5631fd5dc16595887349b101026b714404b257471d2569d89913520" dmcf-pid="zzsbHXaekw" dmcf-ptype="figure">
 <img alt="그래픽=손민균" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/15/chosunbiz/20251215175150070ucge.jpg" data-org-width="640" dmcf-mid="ZGnXrm8BgT" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/15/chosunbiz/20251215175150070ucge.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 그래픽=손민균
 </figcaption>
 </figure>
 ◇ 성능 우위 잃은 오픈AI… 최후의 승자는 누구?
 지난 2022년 챗GPT의 등장에 충격을 받아 코드 레드를 발동했던 구글이 3년 만에 오픈AI를 따라잡으면서 양사의 AI 패권 경쟁은 누가 먼저 강력한 AI 생태계를 구축하는지에 따라 승부가 날 것이란 전망이 나온다. 과거 스마트폰 산업에서 펼쳐진 안드로이드와 iOS간 경쟁 구도가 생성형 AI 시장에서도 나타날 것이란 관측이다.
 오픈AI는 지난 11일(현지시각) GPT-5.2를 공개하면서 “전문적인 지식 업무에 최적화된 가장 강력한 모델”이라고 소개했다. 실제 GPT-5.2는 긴 문서 분석, 스프레드시트 작성, 프레젠테이션 제작, 코딩, 번역 등 복잡한 다단계 작업에 강점을 지닌 ‘실무형 AI’라는 평가를 받는다.
 그러나 접근성 측면에서는 구글이 경쟁 우위를 점했다는 게 업계 관계자들의 진단이다. 제미나이 3는 구글의 심층 검색 기능 ‘AI 모드’, AI 기반 요약 도구 ‘노트북LM’, 지메일, 유튜브, 문서 도구 등 널리 사용되는 구글의 주요 서비스에 통합해 사용자를 확보하는 전략을 쓰고 있다. 나아가 제미나이는 이미지와 영상 생성 기능을 동시에 탑재하고 있는 반면, 챗GPT는 이미지 생성만 지원하고 AI 영상은 별도의 소라 앱을 사용해야 한다는 점에서 제한적이라는 평가도 나온다.
 AI 업계 관계자는 “추후 GPT-5.2가 성능이 더 뛰어난 것으로 밝혀진다 해도 제미나이 3가 구글 생태계 전반에 통합된 점을 감안하면 개별 사용자가 할 수 있는 일의 범위가 챗GPT를 활용할 때보다 더 넓다”고 말했다. 이런 한계를 의식한 오픈AI는 최근 포토샵을 챗GPT에 활용할 수 있도록 어도비와 협력하고, 콘텐츠 공룡 월트디즈니컴퍼니와 캐릭터 라이선스 계약을 체결하는 등 생태계 확장에 총력을 기울이고 있다. 디즈니는 오픈AI에 10억달러(약 1조4700억원)를 투자해 지분을 보유하는 대가로 마블, 픽사, 스타워즈 등 200개 이상 캐릭터를 챗GPT와 소라에서 사용할 수 있도록 제공하기로 했다.
 이미 클라우드, 검색, 플랫폼, AI 칩 설계 등을 아우르는 ‘풀스택’ 역량을 갖춘 구글이 생태계 확장에 유리하다는 점도 오픈AI를 비롯한 경쟁사에 위협 요인이다. 제미나이는 유튜브와 구글 검색, 지도 등 방대한 자체 데이터를 기반으로 학습을 지속할 수 있어 저작권 분쟁을 우회하며 데이터를 확보해야 하는 오픈AI나 앤트로픽 같은 스타트업보다 AI 모델 성능을 개선하기 수월하다. 외부 투자에 의존하는 오픈AI와 달리 자금력도 탄탄해 향후 대규모 인프라 투자를 지속해도 적자 수렁에 빠지거나 사업 기반이 흔들릴 걱정이 없다.
 오픈AI는 당분간 잃어버린 기술적 우위를 되찾는 데 힘쓸 것으로 예상된다. 구글의 거센 추격에 위기를 느낀 샘 올트먼 오픈AI 최고경영자(CEO)는 “전사적 역량을 챗GPT 성능 개선에 집중하라”고 지시했고, 내년 초 또 다른 새 모델을 선보인 뒤 코드 레드를 해제하겠다고 예고했다. 현재 챗GPT의 주간 사용자는 약 9억명으로 AI 챗봇 시장에서 압도적인 점유율 1위이지만, 성장률은 둔화하고 있다. 시장조사업체 센서타워에 따르면 올해 8월부터 11월까지 4개월간 챗GPT의 월간활성이용자(MAU)는 6% 증가한 반면, 같은 기간 제미나이는 AI 이미지 생성 도구 ‘나노 바나나’의 돌풍에 힘입어 사용자가 30% 급증했다.
 - Copyright ⓒ 조선비즈 &amp; Chosun.com -
 </section> 
 </div> 
 Copyright © 조선비즈. 무단전재 및 재배포 금지.

이전

아로아랩스, 중기부 TIPS 선정

12-15
다음

AI 액션플랜 속도전 나선다…"2030년 피지컬AI 1위 목표"(종합)

12-15

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

GPT 5.2 vs 제미나이 3 성능 격차는… 구글 반격에 막 오른 AI 패권 경쟁

멤버랭킹

관련자료

멤버랭킹