[써보고서] 와이파이 끊어도 AI는 살아있다…구글 'AI 엣지 갤러리' 작성일 04-12 33 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">'젬마4' 온디바이스 AI, 비행기 모드서 초 단위 응답…오픈소스 생태계 통한 완성도 주목</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="0kUkTeXSyJ"> <p contents-hash="a7420d7b4fff97a1d8fc0aeaf38b998a8c090b5560504b642bea471bbb1c27fc" dmcf-pid="pEuEydZvvd" dmcf-ptype="general">(지디넷코리아=이나연 기자)<span>구글이 스마트폰에서 인터넷 연결 없이 인공지능(AI) 서비스를</span><span> 직접 구동할 수 있는 모바일 앱 'AI 엣지 갤러리'에 최신 오픈소스 모델 '젬마4</span><span>'를 탑재했다. 클라우드 서버를 거치지 않고 기기 하드웨어에서 직접 AI 연산이 이뤄지는 온디바이스 AI 대중화를 겨냥한 행보다. </span></p> <p contents-hash="e69f8bee193c58e4c826815b650ca5228e9decb59d51775b3cedd3e1afa1a30f" dmcf-pid="UD7DWJ5Tye" dmcf-ptype="general">구글 AI 엣지 갤러리 앱은 구글 플레이스토어와 애플 앱스토어에서 무료로 내려받을 수 있다. 이 앱이 제공하는 AI 챗, 에이전트 스킬, 에스크 이미지 등 주요 기능을 사용하려면 먼저 모델을 설치해야 한다. </p> <p contents-hash="1bab1dca3a2a252dd54e38bf4d371090ad2f64c9b7f697807ff5216863522519" dmcf-pid="uwzwYi1yvR" dmcf-ptype="general"><span>구글 젬마4 '이펙티브 2B(E2B)'와 '이펙티브 4B(E4B)'는 안드로이드 스마트폰 등 경량 디바이스에 최적화된 모델들이다. 배터리와 메모리 제약 환경에서도 AI를 실행할 수 있도록 설계됐다. </span><span>기자는 </span><span>모델 라인업 중 범용성이 가장 높은 E2B 모델을 내려받기로 했다. </span><span>와이파이 연결 상태로는 5분가량 설치가 이어지다 실패 창이 떴다. 모바일 데이터로 전환한 뒤에야 약 2분 만에 설치됐다. </span></p> <figure class="figure_frm origin_fig" contents-hash="350f11b8d2aadeef9839240358d9d1da632467f9c74e3a881be3e82152512373" dmcf-pid="7EuEydZvlM" dmcf-ptype="figure"> <p class="link_figure"><img alt="AI 챗 예시 화면과 실제 안드로이드 스마트폰 구동 화면 갈무리 (사진=구글)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/12/ZDNetKorea/20260412114925866fixi.jpg" data-org-width="639" dmcf-mid="PlsVn3jJlr" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/12/ZDNetKorea/20260412114925866fixi.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> AI 챗 예시 화면과 실제 안드로이드 스마트폰 구동 화면 갈무리 (사진=구글) </figcaption> </figure> <p contents-hash="5d2ad85e0da15e8c17fbf5cc4430a566ff5a6241830eccf42537a8f47aa5d9ce" dmcf-pid="zD7DWJ5Tlx" dmcf-ptype="general"><span>먼저 AI 챗 기능을 사용해 봤다. 비행기 모드를 켠 상태에서 "2026년 현재 한국 대통령이 누구야"라고 묻자 "저는 2025년 1월을 기준으로 학습된 모델이기 때문에 알 수 없습니다"라는 답변이 4.8초 만에 돌아왔다. 서버 없이도 응답은 빨랐지만 학습 데이터 컷오프(마감 시점) 이후 변경된 정보는 반영되지 않는다는 한계가 드러났다. </span></p> <p contents-hash="087d3d2f93cf06597e57f2d8345ad32a3de0024a96ed99b3ecb4731d21ca5c05" dmcf-pid="qwzwYi1ySQ" dmcf-ptype="general">평소 AI 챗봇을 쓸 때 PC와 모바일 간 대화 기록 연동에 익숙했던 탓에 비행기 모드에선 기록이 저장되지 않는 점도 불편했다. 프롬프트 입력창의 '+' 버튼으로 과거 질문을 다시 불러올 수는 있지만 답변까지 저장되진 않는다. 물론 모든 연산이 기기 안에서 처리되는 구조상 프롬프트·이미지 등 민감 데이터가 외부 서버로 전송되지 않는다는 점은 확실한 강점이다.</p> <p contents-hash="e2fc3daa4be08e6263cd3bc39baf72156c3bb0a1e0948d947517066c312a92d8" dmcf-pid="BrqrGntWCP" dmcf-ptype="general">학습 데이터 컷오프와 무관한 질문에선 준수한 성능을 보였다. "애플 앱스토어와 구글플레이의 차이를 알려줘"라고 입력하자 관리 기준, 결제 모델, 생태계 통합성 항목을 표 형태로 구조화해 출력했다. 클라우드 기반 AI 챗봇과 비교해 응답 깊이가 유사한 수준으로, <span>인터넷 없이 스마트폰 안에서 처리됐다는 점에서 특히 실용적이었다.</span></p> <figure class="figure_frm origin_fig" contents-hash="a39d49faa83721fba4ea8e5c7a31b3f0d806f4ad61ef6755b61ce0c173e0cb8b" dmcf-pid="bmBmHLFYS6" dmcf-ptype="figure"> <p class="link_figure"><img alt="에스크 이미지 예시 화면과 실제 안드로이드 스마트폰 구동 화면 갈무리 (사진=구글)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/12/ZDNetKorea/20260412114927142btec.jpg" data-org-width="639" dmcf-mid="3MSQjzwaWi" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/12/ZDNetKorea/20260412114927142btec.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 에스크 이미지 예시 화면과 실제 안드로이드 스마트폰 구동 화면 갈무리 (사진=구글) </figcaption> </figure> <p contents-hash="0812a9726c8f825496eef2c6099dcb881b1972c44a7bebfb5108817fd7f9466c" dmcf-pid="KsbsXo3GC8" dmcf-ptype="general"><span>멀티모달 기능인 에스크 이미지</span><span>에선 엇갈린 결과가 나왔다. 러쉬 </span><span>고체 </span><span>치약을 </span><span>찍어서 첨부하자</span><span> 라벨의 영문 텍스트를 읽어 제품명과 기능을 한국어로 풀어냈다. </span><span>대신 </span><span>치킨과 떡볶이 사진을 올리고 칼로리를 묻자 치킨은 정확히 인식했지만 떡볶이는 "매콤한 닭갈비 계열 볶음"으로 잘못 </span><span>짚었다.</span></p> <p contents-hash="b84450e76e5d37628bee1aae553c86c6e84cdab8d2c8fff1c7af9c1883f0c04f" dmcf-pid="9OKOZg0Hh4" dmcf-ptype="general">"너 떡볶이 모르니?"라고 되묻자 "그렇게 볼 수 있겠군요. 죄송합니다"라며 곧바로 정정하고 치킨과 떡볶이 조합 기준 1인당 약 1500칼로리 수준의 영양성분 분석을 다시 내놨다. 사진만으로 한국 음식을 처음부터 정확히 구분하지는 못했지만 추가 맥락을 주자 유연하게 재추론하는 모습을 보였다.</p> <p contents-hash="dabc66da89cec825fe4f05a7cb79fb36ef1fe1f5907488bbdd7f51ba949dfb6f" dmcf-pid="2I9I5apXyf" dmcf-ptype="general">에이전트 스킬도 눈여겨볼 만했다. 지도 렌더링 등 외부 데이터를 활용하는 기능 특성상 이 항목만 와이파이를 켠 상태에서 시험했다. "구글 본사 위치 지도로 보여줘"라고 입력하자 모델이 JS 스크립트를 직접 호출해 6.8초 만에 미국 캘리포니아주 마운틴뷰 일대 구글 본사 위치가 표시된 인터랙티브 지도를 화면에 렌더링했다.</p> <p contents-hash="c88668b4e68be1da1433456da682189c450f9076c70f06fe4a6697b18fc96d4b" dmcf-pid="VC2C1NUZSV" dmcf-ptype="general"><span>구글은 상업적으로 자유로운 아파치(Apache) 2.0 라이선스로 모델 가중치를 공개했으며 앱 소스코드도 깃허브에 올려 개발자 커뮤니티 기여를 열어뒀다. 다만 앱은 현재 개발 중으로, 성능이 기기 중앙처리장치(CPU)·그래픽처리장치(GPU)에 따라 달라질 수 있다고 명시하고 있다. 젬마4는 오프라인 구동과 프라이버시 보호라는 강점을 갖췄지만 </span><span>실시간 정보 반영과 한국 문화 특화 인식에선 아쉬움이 남았다. 구글이 AI 엣지 갤러리 오픈소스 생태계와 커뮤니티 기여를 통해 이를 어떻게 보완할지 주목된다.</span></p> <p contents-hash="4fb1ed009d33c10404fc19527adcd27b45ccb23c295985028b5fe08341e872f0" dmcf-pid="fT6TpEB3S2" dmcf-ptype="general">이나연 기자(ny@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p> 관련자료 이전 키스오브라이프 ‘아모르 파티’를 이렇게 재해석하다니 “컴백만큼 공들였다”(불후) 04-12 다음 [SW키트] 전기차 설계 혁신, 다쏘시스템 '버추얼 트윈'서 탄생 04-12 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.