“단 5초면 충분” 속도 400배↑…UNIST, 3D 공간인식 AI 개발

작성일 06-08

<div id="layerTranslateNotice" style="display:none;"></div>  <strong class="summary_view" data-translation="true">- 메모리 사용량 64배 절감</strong> 
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="baOKKH3GH5">
          <figure class="figure_frm origin_fig" contents-hash="9dfe2b0717964212e182d910df2e4a6941d9dc6fdf70d85ce31c9df799a78791" dmcf-pid="KqQSSaDgtZ" dmcf-ptype="figure">
           <p class="link_figure"><img alt="주경돈(왼쪽) UNIST 교수와 방재훈 연구원.[UNIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/08/ned/20260608093524443kngo.png" data-org-width="1280" dmcf-mid="qdiHHDCEYt" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/08/ned/20260608093524443kngo.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            주경돈(왼쪽) UNIST 교수와 방재훈 연구원.[UNIST 제공]
           </figcaption>
          </figure>
          <p contents-hash="e25c7c714f26054d723f7967f2c4287c9a3397fafa11b715e575a6175aaedaee" dmcf-pid="9BxvvNwaYX" dmcf-ptype="general">[헤럴드경제=구본혁 기자] 단 5초만에 로봇이 보는 3차원 공간에서 사용자가 원하는 물체를 텍스트 입력으로 빠르고 정확하게 찾아내는 인공지능(AI) 기술이 개발됐다.</p>
          <p contents-hash="6f2b84b91ac784676b7bf45e376f37e217820cffa9b05400f4959c4aa5afd7ee" dmcf-pid="2bMTTjrNHH" dmcf-ptype="general">UNIST(울산과학기술원) 인공지능대학원 주경돈 교수팀은 사용자가 입력한 다양한 말이나 문장을 바탕으로 AI가 3D 복원 공간 속 대상을 찾아내는 ‘오픈어휘 기반 3D 공간 인식 기술’인 ‘LightSplat’을 개발했다고 8일 밝혔다.</p>
          <p contents-hash="2667efc219f3686b966523fb06886421a941e5e778a111dabf9a804859b1534a" dmcf-pid="VKRyyAmj1G" dmcf-ptype="general">최근 3D 공간을 사람의 언어와 연결하는 오픈어휘 3D 공간 인식 기술이 주목받고 있다. 이는 미리 정해진 물체 목록만 인식하는 방식이 아니라, 사용자가 입력한 다양한 단어와 문장을 바탕으로 3D 공간 속 대상을 찾는 기술이다.</p>
          <p contents-hash="03a813a62b204e83dd61d74aa1c66bd07b7da8f01f0bd656cb0dbeb9e72389c2" dmcf-pid="f9eWWcsAGY" dmcf-ptype="general">그러나 기존 3D 공간 인식 기술은 속도와 메모리, 물체 경계 구분에서 한계를 보였다.</p>
          <p contents-hash="eeaa987f5e2ebf0d73290228c9e6587af243a8904f40a5cf7efbf27ff1d4c53f" dmcf-pid="42dYYkOctW" dmcf-ptype="general">연구팀이 개발한 기술은 사용자가 입력한 자연어를 기반으로 3D 공간에서 대상을 찾아내는 오픈어휘 3D 공간 인식 기술이다. 의자, 책상, 문처럼 미리 정해진 범주의 물체만 찾는 방식과 달리, ‘흰색 소파’나 ‘라면 위 달걀’처럼 더 구체적이고 다양한 표현을 통해 원하는 대상을 찾을 수 있다.</p>
          <p contents-hash="14e481c314cf151e3768852a2733ee478a83587a44a44c85f4ced55ad9334e96" dmcf-pid="8VJGGEIkZy" dmcf-ptype="general">이 기술은 기존 오픈어휘 3D 공간 인식 기술 대비 메모리 사용량을 64분의 1 수준으로 낮췄다. 또 3D 가우시안에 의미 정보를 연결해 사람이 쓰는 자연어로 검색할 수 있는 상태로 만드는 시간도 약 5초로 줄였는데, 이는 기존 최신 기술보다 50~400배 빠른 속도다.</p>
          <figure class="figure_frm origin_fig" contents-hash="a8e16c77a474a2050aad908cc8ca4f96be02dc81fc47aa9df6686df3a8816aee" dmcf-pid="6fiHHDCEXT" dmcf-ptype="figure">
           <p class="link_figure"><img alt="ScanNet 데이터셋을 이용한 3D 의미 분할 실험 결과. 라면 위의 달걀, 찻잔, 주걱 등을 기존 보다 더 정확하게 인식함.[UNIST 제공]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/08/ned/20260608093524698zoro.png" data-org-width="1280" dmcf-mid="BK4IInAiX1" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/08/ned/20260608093524698zoro.png" width="658"></p>
           <figcaption class="txt_caption default_figure">
            ScanNet 데이터셋을 이용한 3D 의미 분할 실험 결과. 라면 위의 달걀, 찻잔, 주걱 등을 기존 보다 더 정확하게 인식함.[UNIST 제공]
           </figcaption>
          </figure>
          <p contents-hash="03e149005b9345f8e6a964b7e2074269e418de0dadd5745bb476f982ae697965" dmcf-pid="P4nXXwhD1v" dmcf-ptype="general">메모리 사용량과 검색 준비 시간을 줄였음에도 인식 성능은 기존 기술보다 뛰어났다. LERF-OVS와 DL3DV-OVS 데이터셋을 각각 이용한 실험에서, 라면 위에 올라간 달걀이나 유리잔에 담긴 차처럼 작은 대상부터, 멀리 있는 자동차, 사무실 가구처럼 크기와 배치가 다른 물체까지 또렷하게 구분해 낼 수 있었다. 또 ScanNet의 3D 의미 분할 실험에서는 19개 분류 기준 mIoU 37.11을 기록했다. mIoU는 AI가 찾은 물체 영역이 실제 정답 영역과 얼마나 겹치는지를 보는 지표다.</p>
          <p contents-hash="426ea629e0ad6208c389e7d5d98607ccdd29260797bf156762f108851ea88f81" dmcf-pid="Q6o55mSrtS" dmcf-ptype="general">주경돈 교수는 “사람의 말로 지시를 바로 수행할 수 있는 인간-기계 상호작용이 강화된 로봇 개발, 텍스트로 대상을 바로 지정해 편집을 돕는 AR·VR 콘텐츠 제작, 디지털 트윈 기술 등에 적용 가능할 것”이라고 말했다.</p>
          <p contents-hash="9cde23c5c47457c5b88cc1473ee23089ab9b4a53235b1091a4dcd8dc867b38c5" dmcf-pid="xPg11svmGl" dmcf-ptype="general">과학기술정보통신부와 정보통신기획평가원(IITP)의 인공지능대학원 지원사업 지원으로 수행된 이번 연구결과는 컴퓨터 비전 분야 국제학회인 ‘CVPR 2026’에 채택됐다.</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 헤럴드경제. 무단전재 및 재배포 금지.</p>

이전

'리니지'서 '피지컬AI'로…엔씨·엔비디아 25년 동맹 진화

06-08
다음

[위클리 AI] AI, ‘답변’보다 ‘실행’

06-08

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

“단 5초면 충분” 속도 400배↑…UNIST, 3D 공간인식 AI 개발

멤버랭킹

관련자료

멤버랭킹