숭실대 권민혜 교수 연구팀, 달리면서 학습하는 자율주행차 기술 개발

작성일 09-03

<div id="layerTranslateNotice" style="display:none;"></div>  <strong class="summary_view" data-translation="true">‘오프라인-투-온라인 강화학습’ 기반 기술…소량 데이터만으로도 성능 보정</strong> 
        <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> 
         <section dmcf-sid="7WLLRnHETe">
          <figure class="figure_frm origin_fig" contents-hash="5a1cab963d7e5f8c181f460099f4b668dec68097d71ed5c89a65773f65083e3f" dmcf-pid="zYooeLXDCR" dmcf-ptype="figure">
           <p class="link_figure"><img alt="숭실대 전자정보공학부 권민혜 교수. 숭실대 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202509/03/munhwa/20250903143715528glcs.jpg" data-org-width="331" dmcf-mid="uwQQVPhLld" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202509/03/munhwa/20250903143715528glcs.jpg" width="658"></p>
           <figcaption class="txt_caption default_figure">
            숭실대 전자정보공학부 권민혜 교수. 숭실대 제공
           </figcaption>
          </figure>
          <p contents-hash="7e1d026d7066a0c9eaf6588623689cdc3689a68d4190eae312818af0bfcb950a" dmcf-pid="qGggdoZwyM" dmcf-ptype="general">숭실대(총장 이윤재)는 전자정보공학부 권민혜 교수 연구팀이 자율주행차 학습 과정에 ‘오프라인-투-온라인 강화학습(Offline-to-online Reinforcement Learning)’ 방식을 적용한 새로운 인공지능(AI) 기술을 개발했다고 3일 밝혔다. 이에 따라 자율주행차가 실제 도로 주행을 통해 무한히 많은 데이터를 수집하지 않아도, 소량의 추가 데이터만으로 성능을 보정하고 보다 안전하게 진화할 수 있을 것으로 기대된다.</p>
          <p contents-hash="aba305ba9476d4770e2c27609b669bcccf36cdba4ab4188286405d80838d442f" dmcf-pid="BTmmcrzTSx" dmcf-ptype="general">기존 자율주행 AI는 고속도로, 톨게이트, 차선 합류 구간 등 특정 상황에 맞춰 설계되는 경우가 많아 새로운 환경에 직면하면 성능이 급격히 저하되는 한계가 있었다. 연구팀은 이 문제를 해결하기 위해 통합 의사결정 모델을 제안했다. 이 모델은 단일 정책(policy)으로 다양한 주행 환경을 학습할 수 있어 주행 상황 변화에 안정적이고 유연하게 대응할 수 있다.</p>
          <p contents-hash="c94b51666b8ef31b4c8383668d0762b447524d081342cfbffaa4760d43efb121" dmcf-pid="bysskmqyTQ" dmcf-ptype="general">연구팀은 또 강화학습 기반 자율주행 AI가 방대한 도로 주행 데이터를 필요로 해 비용 부담과 안전사고 위험이 따른다는 한계에 주목했다. 일부 기업은 이를 보완하기 위해 오프라인 학습(offline Reinforcement Learning) 방식을 활용하고 있지만 데이터 제약으로 성능 향상에는 한계가 있었다.</p>
          <p contents-hash="27dc3294c147d35f732c27bf457f7525f5c5ab47f27ebdec05f76a25e84436cd" dmcf-pid="KWOOEsBWlP" dmcf-ptype="general">권 교수 연구팀은 이를 극복하기 위해 오프라인-투-온라인 강화학습 방식을 도입했다. 이를 통해 차량은 기존에 축적된 데이터로 기본 주행 능력을 학습한 뒤 실제 주행에서 확보한 소량의 추가 데이터만으로도 성능을 즉시 보정할 수 있게 됐다. 대규모 데이터를 새로 수집하지 않고도 정교하고 안전한 주행이 가능해진 것이다.</p>
          <p contents-hash="6a23f843aca527c73fceb57107c6f8e9beaf9d9445f63fa6b5ec947935ca194c" dmcf-pid="9YIIDObYS6" dmcf-ptype="general">특히, 연구팀은 △Q함수 재초기화 △Q적응 △정책 분산 재초기화라는 세 가지 핵심 기술을 적용, 온라인 보정 단계에서 흔히 발생하는 불안정한 성능 저하를 막고 안정적인 성능 향상을 달성해냈다. 시뮬레이션 결과, 연구팀이 개발한 기술은 기존 강화학습 방식에 비해 주행 안전성과 효율성 모두 향상됐다. 데이터 품질이 낮아도 안정적인 성능을 유지해 상용 자율주행차에도 바로 적용할 수 있는 가능성을 보여줬다.</p>
          <p contents-hash="b02c1e01758cc452ea92968cd67f1ca64c8c3b589eb539f9773542c34eb0f859" dmcf-pid="2GCCwIKGW8" dmcf-ptype="general">권 교수는 “이번 연구는 자율주행차가 단 한 번에 완벽해지지 않아도 실제 운행 중 확보한 소량의 데이터만으로 지속적인 보정과 발전이 가능하다는 점에서 의미가 크다”며 “피지컬AI 시대에 필수적인 ‘학습 비용 절감’과 ‘안전성 강화’라는 두 가지 목표를 동시에 충족시킬 수 있을 것”이라고 강조했다.</p>
          <p contents-hash="3f1fcc142692b3664548cf3bbd37120e624cab9d7aba6a2be6649ea2b6a0c368" dmcf-pid="VHhhrC9HS4" dmcf-ptype="general">이번 연구 결과는 ‘Scenario-Free Autonomous Driving With Multi-Task Offline-to-Online Reinforcement Learning’라는 제목으로 상위 2%의 국제 저명 학술지 ‘IEEE Transactions on Intelligent Transportation Systems’ 9월호에 게재됐다.</p>
          <p contents-hash="5a161715d64aef193ed78706f65464c065c55bafb3263080f596649d3a43acc3" dmcf-pid="fXllmh2XTf" dmcf-ptype="general">노수빈 기자</p>
         </section> 
        </div> 
        <p class="" data-translation="true">Copyright © 문화일보. 무단전재 및 재배포 금지.</p>

등록된 댓글이 없습니다.

로그인한 회원만 댓글 등록이 가능합니다.

먹튀폴리스

숭실대 권민혜 교수 연구팀, 달리면서 학습하는 자율주행차 기술 개발

멤버랭킹

관련자료

멤버랭킹