“미확인 물체도 정확하게 움켜쥔다” 똑똑한 AI 로봇손, 진화는 계속 작성일 04-29 125 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">- GIST, 세계 최고 성능 AI 로봇 파지 모델 개발</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="35NACT3IZn"> <figure class="figure_frm origin_fig" contents-hash="c81bbb7ce8911864dbf4fecf3784e5b943029ef7fb779f9934e5780d64e38669" dmcf-pid="01jchy0CYi" dmcf-ptype="figure"> <p class="link_figure"><img alt="이번 연구를 수행한 GIST 연구진. 이규빈(왼쪽부터) AI융합학과 교수, 노상준 박사과정생, 김종원·강래영·남동우 석박사통합과정(박사과정), 백승혁 한국기계연구원 선임연구원.[GIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/29/ned/20250429100720616mqea.jpg" data-org-width="1280" dmcf-mid="tsOCXF9HZo" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/29/ned/20250429100720616mqea.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 이번 연구를 수행한 GIST 연구진. 이규빈(왼쪽부터) AI융합학과 교수, 노상준 박사과정생, 김종원·강래영·남동우 석박사통합과정(박사과정), 백승혁 한국기계연구원 선임연구원.[GIST 제공] </figcaption> </figure> <p contents-hash="84a8e202823f353110cfcd491a4ac5fe28831d0e58252db8e103a59a07cc91c4" dmcf-pid="ptAklWphHJ" dmcf-ptype="general">[헤럴드경제=구본혁 기자] 산업 현장에서 로봇이 물체를 정확하고 안정적으로 잡기 위해서는 정교한 파지(把持, grasp) 기술이 필수적이다. 하지만 기존 파지 기술은 물체의 종류나 환경 변화에 따라 새로운 모델 학습이 필요하며, 제한된 데이터세트에 의존하는 한계가 있었다.</p> <p contents-hash="ccab448d119ca9d6f052b4881c885a60291bf8fd1210454522e0eb1a92ffb624" dmcf-pid="UFcESYUl5d" dmcf-ptype="general">광주과학기술원(GIST)은 AI융합학과 이규빈 교수 연구팀이단순한 자동화를 넘어, 작업자와의 협업을 고려한 세계 최고 성능의 혁신적인 로봇 파지 모델 ‘GraspSAM’을 개발했다고 밝혔다.</p> <p contents-hash="7fda5c9146ae0cb64dc4730d54b73fb4d5b30bc6153be9bfc79e845fc39cf957" dmcf-pid="uTdiEsGk1e" dmcf-ptype="general">작업자와의 협업을 고려한 혁신적 AI 모델인 GraspSAM은 점, 박스, 텍스트 등 다양한 형태의 프롬프트 입력을 지원하며, 한 번의 추론만으로 물체의 파지점을 정확히 예측할 수 있도록 설계되었다. 이를 통해 기존 모델의 한계를 극복하고, 학습되지 않은 물체라도 복잡한 환경에서 안정적으로 파지할 수 있는 능력을 갖췄다.</p> <p contents-hash="77ea3c92951ae168d4093b3742296d52096bb2a7583d7c80310c43a60a579bf9" dmcf-pid="7yJnDOHEGR" dmcf-ptype="general">기존 딥러닝 기반 파지 모델들은 환경과 상황에 따라 별도의 AI모델을 학습해야 하는 한계를 지니고 있었다.</p> <p contents-hash="b819ce73bb86e50f0f990e6bd62abe12aac8745f6785e806165c03affed7992f" dmcf-pid="zWiLwIXDZM" dmcf-ptype="general">연구팀은 이를 해결하기 위해 페이스북 모회사 메타(Meta)가 개발한 범용 이미지 분할 모델인 SAM(Segment Anything Model)을 최초로 로봇 파지 출력이 가능하도록 도입했다.</p> <p contents-hash="8d59d44663793ce8d4308eb0efd8766eea7c609687141ae5293dcc12a1c95adc" dmcf-pid="qYnorCZwHx" dmcf-ptype="general">GraspSAM은 SAM의 강력한 객체 분할 능력을 활용해 최소한의 미세 조정만으로 물체의 파지점을 예측하는 혁신적인 모델이다. 이를 위해 어댑터(Adapter) 기법과 학습 가능한 토큰(Learnable Tokens) 기법을 적용해 SAM을 파지점 추론에 최적화했다.</p> <p contents-hash="d4b8c9d31116ff6d79e40da630ed23dc61c18611f50487ddbb0fab0617920c3f" dmcf-pid="BGLgmh5r5Q" dmcf-ptype="general">GraspSAM은 프롬프트 기반 입력을 지원하며 사용자가 제공하는 간단한 점, 박스, 텍스트 입력을 통해 다양한 환경·물체·상황에 즉각적으로 적응할 수 있도록 설계됐다.</p> <figure class="figure_frm origin_fig" contents-hash="1a8c3dab0922df21ff1409d9f5c455652133c73021e67bec33d02ed37f96461b" dmcf-pid="bHoasl1m1P" dmcf-ptype="figure"> <p class="link_figure"><img alt="한 장의 RGB 이미지와 다양한 형태의 프롬프트(점, 박스 또는 언어)를 입력받아 파지 대상 물체의 마스크와 해당 물체 파지를 위한 파지맵을 출력하는 네트워크. [GIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/29/ned/20250429100721020xrea.jpg" data-org-width="1280" dmcf-mid="FkzBQdkP5L" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/29/ned/20250429100721020xrea.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 한 장의 RGB 이미지와 다양한 형태의 프롬프트(점, 박스 또는 언어)를 입력받아 파지 대상 물체의 마스크와 해당 물체 파지를 위한 파지맵을 출력하는 네트워크. [GIST 제공] </figcaption> </figure> <p contents-hash="29230f993f1c3514865cee2d8d45c8bd3b7375101be75a4307bc47648e83b983" dmcf-pid="KXgNOStsX6" dmcf-ptype="general">이를 통해 로봇이 보다 다양한 물체를 손쉽게 잡을 수 있으며, 단 한 번의 연산만으로 파지점을 예측해 산업 현장에서의 적용 범위를 획기적으로 확장했다.</p> <p contents-hash="b7e139fa8d3a54d8b8aac27483e02f1eee5e7511135d1a7626d1240f1fd3fe9e" dmcf-pid="9ZajIvFOX8" dmcf-ptype="general">특히 눈동자 추적 기술과 결합해 작업자의 시선에 맞춰 파지 작업을 수행하는 기능까지 성공적으로 구현함으로써 산업 현장은 물론 다양한 분야에서 폭넓은 활용 가능성을 제시했다.</p> <p contents-hash="23a9de330038113c33f7f99b841f5813b391d27f06811cbcdb587013b3a7d7b3" dmcf-pid="2qOCXF9H54" dmcf-ptype="general">이규빈 교수는 “GraspSAM 모델은 로봇과 사용자의 직관적인 상호작용을 가능하게 하며, 복잡한 환경에서도 탁월한 파지 능력을 발휘해 산업 현장뿐만 아니라 가정용 로봇, 서비스 로봇 등 다양한 분야에 폭넓게 활용될 것으로 기대한다”고 밝혔다.</p> <p contents-hash="e19634fe6418da5239f88163740f0ebe66e13f701d5e782e1b04ad2a21859023" dmcf-pid="VBIhZ32XHf" dmcf-ptype="general">이번 연구결과는 로봇 분야 세계 최고 권위 학회인 ‘IEEE ICRA’에서 5월 발표 예정이다.</p> </section> </div> <p class="" data-translation="true">Copyright © 헤럴드경제. 무단전재 및 재배포 금지.</p> 관련자료 이전 中 '딥시크'에 자극 받은 메타, 첫 AI 개발자 회의로 주도권 잡기 본격화 04-29 다음 포스텍, 빠르고 튼튼한 초이온 고분자 전해질 개발 04-29 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.