“미확인 물체도 정확하게 움켜쥔다” 똑똑한 AI 로봇손, 진화는 계속

작성일 04-29

<div id="layerTranslateNotice" style="display:none;"></div> - GIST, 세계 최고 성능 AI 로봇 파지 모델 개발 
 <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
 <section dmcf-sid="35NACT3IZn">
 <figure class="figure_frm origin_fig" contents-hash="c81bbb7ce8911864dbf4fecf3784e5b943029ef7fb779f9934e5780d64e38669" dmcf-pid="01jchy0CYi" dmcf-ptype="figure">
 <img alt="이번 연구를 수행한 GIST 연구진. 이규빈(왼쪽부터) AI융합학과 교수, 노상준 박사과정생, 김종원·강래영·남동우 석박사통합과정(박사과정), 백승혁 한국기계연구원 선임연구원.[GIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/29/ned/20250429100720616mqea.jpg" data-org-width="1280" dmcf-mid="tsOCXF9HZo" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/29/ned/20250429100720616mqea.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 이번 연구를 수행한 GIST 연구진. 이규빈(왼쪽부터) AI융합학과 교수, 노상준 박사과정생, 김종원·강래영·남동우 석박사통합과정(박사과정), 백승혁 한국기계연구원 선임연구원.[GIST 제공]
 </figcaption>
 </figure>
 [헤럴드경제=구본혁 기자] 산업 현장에서 로봇이 물체를 정확하고 안정적으로 잡기 위해서는 정교한 파지(把持, grasp) 기술이 필수적이다. 하지만 기존 파지 기술은 물체의 종류나 환경 변화에 따라 새로운 모델 학습이 필요하며, 제한된 데이터세트에 의존하는 한계가 있었다.
 광주과학기술원(GIST)은 AI융합학과 이규빈 교수 연구팀이단순한 자동화를 넘어, 작업자와의 협업을 고려한 세계 최고 성능의 혁신적인 로봇 파지 모델 ‘GraspSAM’을 개발했다고 밝혔다.
 작업자와의 협업을 고려한 혁신적 AI 모델인 GraspSAM은 점, 박스, 텍스트 등 다양한 형태의 프롬프트 입력을 지원하며, 한 번의 추론만으로 물체의 파지점을 정확히 예측할 수 있도록 설계되었다. 이를 통해 기존 모델의 한계를 극복하고, 학습되지 않은 물체라도 복잡한 환경에서 안정적으로 파지할 수 있는 능력을 갖췄다.
 기존 딥러닝 기반 파지 모델들은 환경과 상황에 따라 별도의 AI모델을 학습해야 하는 한계를 지니고 있었다.
 연구팀은 이를 해결하기 위해 페이스북 모회사 메타(Meta)가 개발한 범용 이미지 분할 모델인 SAM(Segment Anything Model)을 최초로 로봇 파지 출력이 가능하도록 도입했다.
 GraspSAM은 SAM의 강력한 객체 분할 능력을 활용해 최소한의 미세 조정만으로 물체의 파지점을 예측하는 혁신적인 모델이다. 이를 위해 어댑터(Adapter) 기법과 학습 가능한 토큰(Learnable Tokens) 기법을 적용해 SAM을 파지점 추론에 최적화했다.
 GraspSAM은 프롬프트 기반 입력을 지원하며 사용자가 제공하는 간단한 점, 박스, 텍스트 입력을 통해 다양한 환경·물체·상황에 즉각적으로 적응할 수 있도록 설계됐다.
 <figure class="figure_frm origin_fig" contents-hash="1a8c3dab0922df21ff1409d9f5c455652133c73021e67bec33d02ed37f96461b" dmcf-pid="bHoasl1m1P" dmcf-ptype="figure">
 <img alt="한 장의 RGB 이미지와 다양한 형태의 프롬프트(점, 박스 또는 언어)를 입력받아 파지 대상 물체의 마스크와 해당 물체 파지를 위한 파지맵을 출력하는 네트워크. [GIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/29/ned/20250429100721020xrea.jpg" data-org-width="1280" dmcf-mid="FkzBQdkP5L" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/29/ned/20250429100721020xrea.jpg" width="658">
 <figcaption class="txt_caption default_figure">
 한 장의 RGB 이미지와 다양한 형태의 프롬프트(점, 박스 또는 언어)를 입력받아 파지 대상 물체의 마스크와 해당 물체 파지를 위한 파지맵을 출력하는 네트워크. [GIST 제공]
 </figcaption>
 </figure>
 이를 통해 로봇이 보다 다양한 물체를 손쉽게 잡을 수 있으며, 단 한 번의 연산만으로 파지점을 예측해 산업 현장에서의 적용 범위를 획기적으로 확장했다.
 특히 눈동자 추적 기술과 결합해 작업자의 시선에 맞춰 파지 작업을 수행하는 기능까지 성공적으로 구현함으로써 산업 현장은 물론 다양한 분야에서 폭넓은 활용 가능성을 제시했다.
 이규빈 교수는 “GraspSAM 모델은 로봇과 사용자의 직관적인 상호작용을 가능하게 하며, 복잡한 환경에서도 탁월한 파지 능력을 발휘해 산업 현장뿐만 아니라 가정용 로봇, 서비스 로봇 등 다양한 분야에 폭넓게 활용될 것으로 기대한다”고 밝혔다.
 이번 연구결과는 로봇 분야 세계 최고 권위 학회인 ‘IEEE ICRA’에서 5월 발표 예정이다.
 </section> 
 </div> 
 Copyright © 헤럴드경제. 무단전재 및 재배포 금지.

이전

中 '딥시크'에 자극 받은 메타, 첫 AI 개발자 회의로 주도권 잡기 본격화

04-29
다음

포스텍, 빠르고 튼튼한 초이온 고분자 전해질 개발

04-29

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

“미확인 물체도 정확하게 움켜쥔다” 똑똑한 AI 로봇손, 진화는 계속

멤버랭킹

관련자료

멤버랭킹