"AI가 인간처럼 앱 실행"…구글·오픈AI '차세대 AI' 선점 경쟁 작성일 10-10 60 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">AI가 직접 컴퓨터 화면 클릭하고 캔바 앱 실행하는 시대 열려<br>복잡한 업무 여전히 한계…AI 에이전트 확산에 해킹 우려도 커져</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Yv5lZBHE5i"> <figure class="figure_frm origin_fig" contents-hash="930ed2ead9fb91858b586e8530eaafe912fd447e967dfb4b30ed720e6bd2f57a" dmcf-pid="GT1S5bXDHJ" dmcf-ptype="figure"> <p class="link_figure"><img alt="구글·오픈AI가 차세대 AI 에이전트 기술 관련 퍼플렉시티 AI 이미지 생성 요청 이미지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202510/10/NEWS1/20251010070626494dtjk.jpg" data-org-width="340" dmcf-mid="PDfPLmiBZa" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202510/10/NEWS1/20251010070626494dtjk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 구글·오픈AI가 차세대 AI 에이전트 기술 관련 퍼플렉시티 AI 이미지 생성 요청 이미지 </figcaption> </figure> <p contents-hash="6782f515d293106421b14d9162cce897b5d3093220a7f51a5ecb8f5a326e8546" dmcf-pid="Hytv1KZw1d" dmcf-ptype="general">(서울=뉴스1) 김민석 기자 = 구글·오픈AI가 각자의 접근법으로 차별화한 차세대 AI 에이전트 기술(AI가 인간처럼 직접 컴퓨터 조작 또는 서비스 앱 실행)을 공개하며 플랫폼 선점 경쟁을 본격화했다.</p> <p contents-hash="53b180eafaef8bdd2396ad0765179ae05bc51fea5b41690db42e1b94c9fb635b" dmcf-pid="XrvDSFhLGe" dmcf-ptype="general">10일 IT 업계에 따르면 구글은 이달 7일(현지시간) AI 에이전트가 컴퓨터 GUI(그래픽 사용자 인터페이스)와 직접 상호작용할 수 있는 '제미나이 2.5 컴퓨터 유즈'(Gemini 2.5 Computer Use) 모델을 프리뷰 형태로 공개했다.</p> <p contents-hash="3b842d3f8ea39bca71dff845a3a4d480753ff3e535a598a3a12d6943dcf083c9" dmcf-pid="ZmTwv3loGR" dmcf-ptype="general">제미나이 2.5 컴퓨터 유즈는 이용자 프롬프트와 컴퓨터 화면을 분석해 △마우스 클릭·스크롤 △키보드 타이핑 등 13가지 UI 액션을 실행할 수 있다. 이 모델은 스크린샷과 작업 기록을 분석한 후 다음 행동을 결정·실행하는 순환 구조로 작동한다. 개발자는 '구글 AI 스튜디오'와 '버텍스 AI'(Vertex AI)를 통해 이용할 수 있다.</p> <div class="video_frm" dmcf-pid="5syrT0SgZM" dmcf-ptype="embed"> <div class="layer_vod"> <div class="vod_player"> <iframe allowfullscreen class="player_iframe" dmcf-mid="yPq5zQuS1L" dmcf-mtype="video/youtube" frameborder="0" height="370" id="video@yPq5zQuS1L" scrolling="no" src="https://www.youtube.com/embed/_lu-FcPUIfM?origin=https://v.daum.net&enablejsapi=1&playsinline=1" width="100%"></iframe> </div> </div> </div> <p contents-hash="c19df9b3ff350766b297ecda9feb76cea5794fb3ed4012d5b8052e2da6ac7903" dmcf-pid="1OWmypva5x" dmcf-ptype="general">구글은 시연 영상도 공개했다.</p> <p contents-hash="5c8f7aad6f5f7245d055df6e4f905bcd0611ce6a5d70430fc3e68183fa9ce0b2" dmcf-pid="tIYsWUTNtQ" dmcf-ptype="general">영상에는 AI가 반려동물 예약 정보가 담긴 사이트에서 캘리포니아 거주 동물의 데이터를 추출한 후 이를 별도의 CRM 웹사이트에 스스로 입력하거나 특정 전문의를 찾고 진료 예약 등을 자동으로 수행하는 장면이 담겼다.</p> <p contents-hash="05c1a176ec66e43307523c1bf8904632b1250383a13ceab53c961c1a62a918a3" dmcf-pid="FCGOYuyjZP" dmcf-ptype="general">구글은 제미나이 2.5 컴퓨터 유즈 성능이 경쟁 모델을 앞질렀다고 강조했다. 웹보이저 벤치마크에서 제미나이는 79.9%의 성능을 기록해 클로드(69.4%) 오픈AI(61.0%)를 상회했다.</p> <figure class="figure_frm origin_fig" contents-hash="2a0f4fc8fbb16b8653cee031cc70837d3d86c232f72028570a1f9d446b5f25cc" dmcf-pid="3hHIG7WAG6" dmcf-ptype="figure"> <p class="link_figure"><img alt="US-TECH-AI-ALTMAN ⓒ AFP=뉴스1" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202510/10/NEWS1/20251010070627951dnpc.jpg" data-org-width="1400" dmcf-mid="QpFUVi9Htg" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202510/10/NEWS1/20251010070627951dnpc.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> US-TECH-AI-ALTMAN ⓒ AFP=뉴스1 </figcaption> </figure> <p contents-hash="f32c1c67483dcb99af540db6c5ca952240ad6ef6450535340f209aae815c8d91" dmcf-pid="0lXCHzYc18" dmcf-ptype="general">오픈AI는 챗GPT를 중심으로 모든 서비스를 담아 AI 시대의 새로운 운영체제(OS)가 되겠다는 목표다.</p> <p contents-hash="5f106167377a2b624705f24fad015062372e2eb9250300e34618e4b8122a4268" dmcf-pid="pSZhXqGkX4" dmcf-ptype="general">오픈AI는 이를 실현하는 단계로 지난 6일(현지시간) 열린 연례 개발자 회의 '데브데이 2025'에서 '앱 SDK'를 공개했다.</p> <p contents-hash="eb2ae2715cb8efe9fa1918ad69cb87228459546ac10493b3a8b64361999d498b" dmcf-pid="Uv5lZBHEYf" dmcf-ptype="general">앱 SDK는 이용자 요청에 따라 AI가 챗GPT 내에서 △질로우 △캔바 △스포티파이 등 외부 서비스를 직접 실행해 작업을 완료한다. 대화창에 '캔바를 활용해 반려견 산책 스타트업 포스터를 만들어줘'라고 요청하면 자동으로 템플릿을 선택해 완성된 디자인을 생성하는 식이다.</p> <p contents-hash="40d1c7e50902227bc3acfc795206c8d06ab5def62231bb03cb6d5252ffbbe694" dmcf-pid="uT1S5bXDGV" dmcf-ptype="general">오픈AI는 캔바·스포티파이·질로우 외 코세라·피그마·익스피디아·부킹닷컴 등과 협약을 맺었다고 발표했다. 우버 서비스도 연내 추가한다는 방침이다.</p> <figure class="figure_frm origin_fig" contents-hash="8b193d9850c7f5a5b893431519aa0e74fc08cb181b2220605a239447782cce28" dmcf-pid="73btBMzTZ2" dmcf-ptype="figure"> <p class="link_figure"><img alt="오픈AI 에이전트 키트 사용 예시(오픈AI 제공)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202510/10/NEWS1/20251010070629366uslp.jpg" data-org-width="640" dmcf-mid="xPDsWUTNXo" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202510/10/NEWS1/20251010070629366uslp.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 오픈AI 에이전트 키트 사용 예시(오픈AI 제공) </figcaption> </figure> <p contents-hash="5ff70fbe58fdc32820cf1679978b6f425387e18dd4f8c963e974a83566d30223" dmcf-pid="z0KFbRqyG9" dmcf-ptype="general">전문가들은 양사가 기존 API 방식의 한계를 돌파한 기술을 선보였다고 평가하면서도 한계점이 아직 있다고 분석했다. 간단한 작업은 높은 정확도로 수행하지만, 고난도의 복잡한 작업을 명령하면 실패하는 경우가 많기 때문이다.</p> <p contents-hash="b4540dcb9d8e5dbda05ad8d2e432d59fa8d389e410a05b33a9dbf45bb3570e9c" dmcf-pid="qp93KeBWtK" dmcf-ptype="general">AI 에이전트 확산에 따른 보안·해킹 우려도 점점 커지고 있다.</p> <p contents-hash="d3b1069536da4c3c4a6d02d1ae4c133f0a71f01b65d06d40d9f615f522cc4041" dmcf-pid="BU209dbYXb" dmcf-ptype="general">스톡홀름국제평화연구소(SIPRI)는 "AI 에이전트 간 상호작용은 현재 겪는 사이버보안 문제를 훨씬 관리하기 어렵게 만들 수 있다"며 "악의적 행위자들이 에이전트 간 상호작용을 해킹해 민감한 정보를 빼내거나 바이러스를 전파할 경우 연쇄적 효과를 예측하기 힘들게 될 것"이라고 우려했다.</p> <p contents-hash="71e46a0ade66bc4f7135d80de1b1446a0eab96a6b5de7d6040188dd92062c040" dmcf-pid="buVp2JKGXB" dmcf-ptype="general">ideaed@news1.kr<br><br><strong><용어설명></strong><br><br>■ API<br>API는 응용프로그램 인터페이스(Application Programming Interface)로 하나의 소프트웨어 컴포넌트가 다른 소프트웨어 컴포넌트와 상호작용할 수 있도록 설계된 인터페이스다. 즉, 소프트웨어끼리 서로 정보를 주고받고 기능을 사용하게 해주는 중간다리다.<br><br>■ MCP<br>MCP(Model Context Protocol)는 인공지능(AI) 대형언어모델(LLM)과 외부 데이터 소스·도구·애플리케이션을 연결해주는 개방형 표준 프로토콜이다. AI 모델이 실시간으로 외부 정보를 가져오고 다양한 도구를 활용할 수 있도록 하는 범용 인터페이스 역할을 한다.<br><br>■ SDK<br>SDK(Software Development Kit·소프트웨어 개발 키트)는 특정 하드웨어·소프트웨어 플랫폼에서 개발자가 새로운 애플리케이션을 개발할 수 있도록 도와주는 패키지(도구 모음·라이브러리·문서·예제 코드·API 등)다.<br><br> </p> </section> </div> <p class="" data-translation="true">Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.</p> 관련자료 이전 조인철 의원 "생산기술연구원 징계 최다…시험성적서 부정 발급 등으로 5년간 42회" 10-10 다음 이지혜, 하와이 여행 부러움 금지 “육아애송이들아, 빡센 육아+거북목 보이니” 씁쓸 10-10 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.