AI에게 ‘요약노트’만 줘도···자율주행차 학습시간 수십 배 단축 작성일 12-01 27 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">UNIST, 3D 포인트 클라우드 데이터 증류 기법 개발<br>데이터 순서 불일치·회전 변동성 동시 해결 및 범용 성능 입증</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Kr9vWnMVhB"> <figure class="figure_frm origin_fig" contents-hash="4f6addca4e161a8b023703f727caa18bc848b92d834c71311eac69bb18a817ca" dmcf-pid="9m2TYLRfSq" dmcf-ptype="figure"> <p class="link_figure"><img alt="3D 데이터셋 증류 기술 개요. 연구그림=UNIST" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/01/seouleconomy/20251201111015594rcqc.jpg" data-org-width="640" dmcf-mid="bvnUzOEoTb" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/01/seouleconomy/20251201111015594rcqc.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 3D 데이터셋 증류 기술 개요. 연구그림=UNIST </figcaption> </figure> <div contents-hash="acd66550e09c04077eb52fbf1a6cf9bee7d03355ed3ff2f9313d3ac15869d24f" dmcf-pid="2sVyGoe4hz" dmcf-ptype="general"> [서울경제] <p>자율주행차나 로봇의 눈 역할을 하는 사물 인식 인공지능(AI) 모델이 학습해야 할 데이터의 양을 요약해도 성능을 보존할 수 있어, 학습 효율을 극대화하는 기술이 나왔다. AI 모델 개발에 드는 시간과 연산 비용을 크게 줄일 수 있게 됐다.</p> </div> <p contents-hash="2c180a3ad154a443dabebf91a0f6810891dc9baaa957a225d4eac8d2ab27bd53" dmcf-pid="VOfWHgd8C7" dmcf-ptype="general">울산과학기술원(UNIST) 인공지능대학원 심재영 교수팀은 3D 포인트 클라우드(Point Cloud) 데이터를 효과적으로 압축해 학습 효율을 높이는 ‘데이터 증류(dataset distillation)’ 기술을 개발했다고 1일 밝혔다.</p> <p contents-hash="4a2640debeb4ccf9881f18d1e51b11893b9b0c0635df76160a4c3994745458a8" dmcf-pid="fI4YXaJ6Su" dmcf-ptype="general">데이터 증류는 대규모 학습 데이터 중 요점만을 추출해 새로운 ‘요약 데이터’를 만들어내는 기술이다. 3D 포인트 클라우드 데이터는 이 데이터 증류 기술 적용이 까다로운 형태의 데이터로 꼽힌다. 3D 포인트 클라우드 데이터는 사물을 점으로 표현해 놓은 데이터인데, 점들의 배열에 정해진 순서가 없고, 물체가 회전해 있는 경우가 많은 특성 때문이다.</p> <p contents-hash="2276ac6298d19e12adb486f41c77e3bdf004035d6f6c96b8655e13a44e426dda" dmcf-pid="43jb2vOcvU" dmcf-ptype="general">이러한 특성은 요약 데이터를 생성하는 과정에서 치명적인 걸림돌이 된다. 데이터 증류는 원본 데이터와 요약 데이터의 특징을 ‘비교’하는 방식으로 요약 데이터의 완성도를 높여 나가게 되는데, 위와 같은 데이터 특성 때문에 제대로 된 비교(매칭)가 불가능하다. 결국 엉뚱한 부위끼리 비교하게 되거나 같은 물체도 다른 물체로 인식해 잘못된 정보가 반영된 요약 데이터를 만들게 된다.</p> <p contents-hash="abd539def7ec520a63dac6a073bd74e8bd2f399d90709abb03f9260a20791dad" dmcf-pid="80AKVTIkWp" dmcf-ptype="general">연구팀은 이 문제를 해결한 데이터 증류 기술을 개발했다. 순서가 제각각인 점 데이터의 의미 구조를 자동으로 정렬해주는 손실 함수(SADM)와 물체의 회전 각도를 AI가 스스로 최적화해 학습하도록 하는 방향 최적화(learnable rotation) 기법이 적용된 기술이다.</p> <p contents-hash="ebd8685e293b6f0324c54b2c212462dee6c10f7f1442b0411b636d8962691367" dmcf-pid="6pc9fyCEy0" dmcf-ptype="general">개발된 데이터 증류 기술은 원본 대비 수십 분의 1 수준으로 데이터를 줄여도 모델 정확도를 유지하는 것으로 확인됐다. 특히, 특정 데이터셋(ModelNet40)에서는 데이터를 원본 크기의 25분의 1로 줄인 요약 데이터로 학습해도 80.1퍼센트의 인식 정확도를 기록해, 전체 데이터로 학습했을 때의 87.8퍼센트와 큰 차이가 나지 않았다. 이는 높은 압축률에서도 학습 효율과 성능을 균형 있게 확보할 수 있음을 보여주는 결과다.</p> <p contents-hash="f1ebec23600da67b4b1ec9663c08bc9aa5e0b639203c62ccc9b29b5d2ee35bae" dmcf-pid="PUk24WhDS3" dmcf-ptype="general">심재영 교수는 “이번 기술은 3D 점 데이터의 무질서한 구조와 회전 불확실성으로 인해 기존 기술들이 겪던 매칭 오류를 근본적으로 해결한 것”이라며 “자율주행, 드론, 로봇, 디지털 트윈 등 대규모 3D 데이터 활용이 필요한 분야에서 AI 학습 비용과 시간을 크게 줄이는 데 기여할 수 있을 것”이라고 말했다.</p> <div contents-hash="edda8357179fa48e0784454c7ccb235912d7199a3391d55de647d65b9b4be067" dmcf-pid="QuEV8YlwWF" dmcf-ptype="general"> <p>이번 연구 결과는 3대 인공지능 분야 권위 국제학회인 ‘신경정보처리시스템학회(NeurIPS) 2025’에 정식 논문으로 채택됐다. 연구수행은 과학기술정보통신부 한국연구재단, 정보통신기획평가원의 지원을 받아 이뤄졌다. 2025년 신경정보처리시스템학회는 12월 2일부터 7일까지 미국 샌디에이고에서 열린다.</p> 울산=장지승 기자 jjs@sedaily.com </div> </section> </div> <p class="" data-translation="true">Copyright © 서울경제. 무단전재 및 재배포 금지.</p> 관련자료 이전 보령 CCU 메가 프로젝트 예타 통과…1402억 투입 e-SAF 생산 700톤 실증 12-01 다음 IBS 바이러스·생명 분야 신규 연구단·CI그룹 출범 12-01 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.