"단어·문장 입력하면 3D 공간 속 물체 찾는 AI 기술 개발" 작성일 06-08 21 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">UNIST 연구…메모리·검색 준비 시간 줄이고 인식 성능 높여</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="GUXHQlGh5E"> <figure class="figure_frm origin_fig" contents-hash="7bb4827f6eaa0902cb00a5dd61a43ef8f04064cbfad81e6b33076f2e0b7f9b6c" dmcf-pid="HuZXxSHlYk" dmcf-ptype="figure"> <p class="link_figure"><img alt="연구 그림 사용자가 텍스트로 특정 물체를 지정하면 라이트스플랫이 해당 물체를 3D 공간에서 선택하고 편집하는 모습. [울산과학기술원 제공. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/08/yonhap/20260608152251895ryro.jpg" data-org-width="1200" dmcf-mid="YYoLGxnQYD" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/08/yonhap/20260608152251895ryro.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 연구 그림 사용자가 텍스트로 특정 물체를 지정하면 라이트스플랫이 해당 물체를 3D 공간에서 선택하고 편집하는 모습. [울산과학기술원 제공. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="479d964be76f9358a9ec38ff3328d82146a484d1350810dc01b5d6721af76f09" dmcf-pid="X8qzNt71Gc" dmcf-ptype="general">(울산=연합뉴스) 김용태 기자 = 증강현실(AR) 화면이나 로봇이 보는 3차원 공간에서 사용자가 입력한 텍스트를 통해 물체를 찾아내는 인공지능(AI) 기술이 나왔다.</p> <p contents-hash="6a34827bdd4bd8e58fa78c297bbbb74aac787c78fa07e5b68709ec8239e01ec3" dmcf-pid="Z6BqjFzt1A" dmcf-ptype="general">울산과학기술원(UNIST) 인공지능대학원 주경돈 교수팀은 사용자가 입력한 말이나 문장을 통해 AI가 3D 공간 속 대상을 찾아내는 '오픈어휘 기반 3D 공간 인식 기술'인 '라이트스플랫'(LightSplat)을 개발했다고 8일 밝혔다.</p> <p contents-hash="3fbb665afe5cd216791800cde70b16bd31cad18f53ed3f1e5761da4ea1770df6" dmcf-pid="5PbBA3qF5j" dmcf-ptype="general">로봇이나 증강현실 기술에서는 카메라로 들어온 2D 이미지를 기계가 인식할 수 있는 위치·색·투명도 정보를 가진 작은 점 입자(가우시안)들이 모인 3D 공간으로 복원한다.</p> <p contents-hash="07226a5e7c75ee253547af6f752ca1aa467cb4bc29d05d05366018d867e6731a" dmcf-pid="1QKbc0B3ZN" dmcf-ptype="general">3D 공간 인식은 이렇게 복원된 공간에서 어떤 물체가 어디에 있고, 어느 영역을 차지하는지를 찾는 기술이다.</p> <p contents-hash="16a79916ba3a2293669897ed6a272f34c40b01f57bdf1f21f6ab2793b043ee1d" dmcf-pid="tx9Kkpb0Xa" dmcf-ptype="general">연구팀이 개발한 기술은 사용자가 입력한 자연어를 기반으로 3D 공간에서 대상을 찾아내는 오픈어휘 3D 공간 인식 기술이다.</p> <p contents-hash="9ec3409f804909bfa4b51af973acb27d247e4a4a4b49c6e4c190696b348c2d14" dmcf-pid="FM29EUKpGg" dmcf-ptype="general">의자, 책상, 문처럼 미리 정해진 범주의 물체만 찾는 방식과 달리 '흰색 소파', '라면 위 달걀' 등 더 구체적이고 다양한 표현을 통해 원하는 대상을 찾을 수 있다.</p> <p contents-hash="d3609bfca34ae8c8809cf622659bfd9a540ed4cdb4e058c076b8b56bb3268e7a" dmcf-pid="3RV2Du9UHo" dmcf-ptype="general">이 기술은 기존 오픈어휘 3D 공간 인식 기술과 비교해 메모리 사용량을 64분의 1 수준으로 낮췄다.</p> <p contents-hash="12d9ec3bb4d9b5efe397f700498612d5fdeadbdcc4760188232c1cd9db2c6e7e" dmcf-pid="0efVw72uHL" dmcf-ptype="general">또 3D 가우시안에 의미 정보를 연결해 사람이 쓰는 자연어로 검색할 수 있게 만드는 준비 시간도 약 5초로 줄였다. 이는 기존 최신 기술보다 50∼400배 빠른 속도다.</p> <p contents-hash="54365945bac9007e4759dabb5f0118534604849cc47328d557f157b9fea00680" dmcf-pid="pd4frzV71n" dmcf-ptype="general">이는 기존 기술이 3D 공간의 각 점 입자마다 긴 숫자 형태의 언어 특징값을 저장하는 것과 달리, 라이트스플랫은 각 점 입자에 2바이트짜리 짧은 인덱스만 붙인 덕분이다.</p> <p contents-hash="2920e202df1c619fa3a27070bc07aeb99f9f418e94799cb794f062f54c361014" dmcf-pid="UJ84mqfz5i" dmcf-ptype="general">실제 의미 정보는 별도 표에 저장해두고 필요할 때 인덱스를 통해 찾아보는 방식으로 3D 공간을 표현하는 데 필요한 메모리를 크게 줄였다. </p> <p contents-hash="4fd7bbd7b8bc43bce512edc25d0fe40aab8d70807d1bf5d461b0ec98342246cc" dmcf-pid="ui68sB4qZJ" dmcf-ptype="general">메모리 사용량과 검색 준비 시간을 줄였음에도 인식 성능은 기존 기술보다 뛰어났다.</p> <p contents-hash="cbdfd9b8dc5476bcd4bd5b9074e4fd1f9e209413c78f537cf2867b7d2ae619f9" dmcf-pid="7pHGPhYCtd" dmcf-ptype="general">실제 실험에서 라면 위에 올라간 달걀이나 유리잔에 담긴 차처럼 작은 대상부터 멀리 있는 자동차, 사무실 가구처럼 크기와 배치가 다른 물체까지 구분해 냈다고 연구팀은 설명했다.</p> <p contents-hash="dadd1c36ccdac8fd946567cf5b3b57d89e591f1adaea485c28172bbffb42240b" dmcf-pid="zUXHQlGhZe" dmcf-ptype="general">주경돈 교수는 "사람의 말로 지시를 바로 수행할 수 있는 인간-기계 상호작용이 강화된 로봇 개발, 텍스트로 대상을 바로 지정해 편집을 돕는 AR·VR 콘텐츠 제작, 디지털 트윈 기술 등에 적용할 수 있을 것"이라고 말했다.</p> <p contents-hash="af582e20885d2c6f4f333e5b2f9b83676e11f1702551974e7e49d206309fdba1" dmcf-pid="quZXxSHlGR" dmcf-ptype="general">연구 결과는 컴퓨터 비전 분야 권위 학회인 'CVPR 2026'(Conference on Computer Vision and Pattern Recognition)에서 발표됐다. CVPR 2026은 지난 3∼5일 미국 덴버에서 열렸다.</p> <p contents-hash="2f8478f45f2f16e2611f7b2270e650e5fd51ed761b2cd3e2812b392fc1a58963" dmcf-pid="B75ZMvXStM" dmcf-ptype="general">연구는 과학기술정보통신부와 정보통신기획평가원의 인공지능대학원 지원사업 등을 통해 이뤄졌다.</p> <p contents-hash="93bb3030303e444b383eed2e71793e300527f65857827c9b8c8ddb397c9fceae" dmcf-pid="bz15RTZvYx" dmcf-ptype="general">yongtae@yna.co.kr</p> <p contents-hash="d8adbd697d87a03d92eb8f61493e42e0cab6fd1b1e1ce3c82b8ca5b767489085" dmcf-pid="9BFtdW1yYP" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p> 관련자료 이전 '21세기 아문센' 중국산 4족 보행 로봇, 북극서 극한 테스트 06-08 다음 '밀도의 경제', AI와 중국발 초경쟁 시대, 한국기업 성장공식 바뀐다 06-08 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.