서울대, 말버릇·추임새까지 따라 하는 AI 대화 모델 개발 작성일 05-30 99 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">김건희 서울대 컴퓨터공학부 교수 연구진</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Q1RSwmFOdB"> <figure class="figure_frm origin_fig" contents-hash="5a75137d7555761555e17d35868d441ca7c8a4dc2c49224bebfec586e11dafbc" dmcf-pid="xtevrs3IRq" dmcf-ptype="figure"> <p class="link_figure"><img alt="(왼쪽부터) 김강욱 서울대 컴퓨터공학부 학사과정생, 김건희 서울대 컴퓨터공학부 교수, 이세훈 서울대 컴퓨터공학부 박사과정생./서울대 공과대학" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/30/chosunbiz/20250530114210917fcmp.jpg" data-org-width="700" dmcf-mid="WiIWLgTNLm" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/30/chosunbiz/20250530114210917fcmp.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> (왼쪽부터) 김강욱 서울대 컴퓨터공학부 학사과정생, 김건희 서울대 컴퓨터공학부 교수, 이세훈 서울대 컴퓨터공학부 박사과정생./서울대 공과대학 </figcaption> </figure> <figure class="figure_frm origin_fig" contents-hash="4d0c800680a743afac3d3afbb72f8b7c6386d6e6bb93605f3c6e714daf5fc336" dmcf-pid="yoGPb9aVnz" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/30/chosunbiz/20250530114211299asec.png" data-org-width="1232" dmcf-mid="YpHk2fA8Mr" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/30/chosunbiz/20250530114211299asec.png" width="658"></p> </figure> <p contents-hash="d5c4f634fb76ad474491fae1df69641c315fc5456679b773ee2431d344b62512" dmcf-pid="WgHQK2NfR7" dmcf-ptype="general">서울대 공과대학은 김건희 컴퓨터공학부 교수 연구진이 말버릇, 추임새, 끼어들기 등 사람의 대화 행동을 인공지능(AI)이 이해하고 재현하도록 돕는 음성 대화 생성 기술을 개발했다고 30일 밝혔다.</p> <p contents-hash="63874f58460c65aa2a1719df3d5682e0939187c5c209631add24972a07217cec" dmcf-pid="YaXx9Vj4Lu" dmcf-ptype="general">연구진은 사람들이 음성 대화를 나눌 때, 텍스트 대화에서는 잘 나타나지 않는 대화 행동을 보이는 점에 주목했다. 예컨대 우리는 대화할 때 ‘음…‘, ’그니까…' 같은 말버릇을 쓰고, 적절한 순간에 ‘맞아’, ‘응’ 같은 추임새를 넣거나, 때로는 상대의 말을 끊기도 한다. 하지만 이런 미묘한 특징들을 반영하지 못한 기존 AI 대화 시스템의 말투는 부자연스럽고 기계적으로 느껴질 수밖에 없었다.</p> <p contents-hash="9aab5009ccd96d5b4e65f21c3573202b4173e62bc81b85191d6f5174d6e1a429" dmcf-pid="GQIBF0MUdU" dmcf-ptype="general">먼저 연구진은 실제 대화 환경을 최대한 비슷하게 재현하기 위해, 10만 개의 대화 패턴과 총 2000시간 분량의 음성 대화를 모아, ‘Behavior-SD(Spoken Dialogue)’ 데이터 세트를 구축했다. 이 대규모의 데이터는 사람 간의 자연스러운 대화를 정밀하게 구현하도록 설계됐다. 각 화자가 주고받는 단순한 문장에, 세밀하게 구분된 다양한 대화 행동을 더한 방식을 사용했다.</p> <p contents-hash="7ba40b4273f644f4e8bbb42cf37ad702c5c5ef3a1bd2f8df48bcc5360127651a" dmcf-pid="HxCb3pRuRp" dmcf-ptype="general">이렇게 구축한 데이터를 바탕으로 연구팀은 행동 기반 대화 생성 AI 모델인 ‘BeDLM’을 개발했다. 거대 언어 모델(Large Language Model, LLM)에 기반한 BeDLM은 대화 상황과 두 화자의 행동 패턴이 입력되면, 실제 사람 간 대화에 가까운 음성 대화를 손쉽게 만들어낸다. 추임새를 넣거나 말을 끊는 습관, 말버릇 등의 대화 행동을 자연스럽게 조절해 반영하기 때문에, 기존 AI 대화 시스템의 한계를 극복하고 한층 더 사람다운 음성 대화를 생성할 수 있다.</p> <p contents-hash="84533a73c4bf34f88052784ca7964ff2250e62cd96cbd73565b6d683094cd5e7" dmcf-pid="XMhK0Ue7e0" dmcf-ptype="general">BeDLM은 향후 팟캐스트 콘텐츠 제작, 상담 AI, 개인 맞춤형 음성 비서 등 사람과 AI 간의 상호작용과 정서적 반응이 필요한 여러 분야에서 널리 활용될 것으로 예상된다. 나아가 이 기술은 앞으로 상담, 교육, 돌봄 서비스 등 다양한 영역에서 사람과 AI가 더욱 원활하게 소통할 수 있도록 돕는 데에도 이용될 전망이다. 아울러 이번 연구에서 개발된 Behavior-SD 데이터 세트와 코드는 모두 오픈소스로 공개됐다.</p> <p contents-hash="8fef760eb2b987ff93c8359ca846508aa98baf3b8a70506897c7743c023ece25" dmcf-pid="ZRl9pudzM3" dmcf-ptype="general">김건희 교수는 “대화하는 사람은 보통 말하는 중에도 귀를 열고 상대방의 음성적 반응과 시각적 반응에 적응하고 맞춰가며 대화를 이끄는데, 지금까지 개발된 AI 대화 생성 모델은 이를 반영하지 못했기 때문에 그 한계를 넘고자 했다”며 “AI가 사람처럼 자연스럽게 대화하는 기술을 한 단계 더 발전시켰다는 점에서 이번 연구의 의미가 크다”고 밝혔다.</p> <p contents-hash="f3ca58f2fe241a43d9529464eddb22a842d4f0cf20c11d60c6be02739685518b" dmcf-pid="5eS2U7JqiF" dmcf-ptype="general">연구진은 지난 4월 29일부터 5월 4일까지 미국 뉴멕시코주 앨버커키에서 열린 ‘북미 전산언어학회(NAACL 2025)’에서 해당 연구 논문을 구두 발표했으며, 음성 처리 및 음성 언어 이해 분야에서 최고 논문상(Senior Area Chair Award)을 수상했다. NAACL은 컴퓨터가 인간의 언어를 이해, 생성할 수 있도록 해주는 AI의 한 분야인 자연어 처리(NLP) 관련 세계 최고 권위 학회 중 하나다.</p> <p contents-hash="546b12f99becc717f80c06c57833a89c227e3857bd12947987bbfda4a3c82f37" dmcf-pid="1dvVuziBnt" dmcf-ptype="general">참고 자료</p> <p contents-hash="b1429d787e5dc09092f563fa353be1a27e334cc4f6628b8fb44b5dc4b1d7f870" dmcf-pid="tJTf7qnbd1" dmcf-ptype="general">2025 Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics(NAACL2025), LINK: <span>https://aclanthology.org/2025.naacl-long.484/</span></p> <p contents-hash="7b353773dfded0b4ff3b6aa5f84818216992849724e23e825e93c89d497fd25e" dmcf-pid="Fiy4zBLKL5" dmcf-ptype="general">- Copyright ⓒ 조선비즈 & Chosun.com -</p> </section> </div> <p class="" data-translation="true">Copyright © 조선비즈. 무단전재 및 재배포 금지.</p> 관련자료 이전 배우 그만 둔 지윤미 근황, 연매출 100억 사업가 워킹맘 "많이 벌어" (관종언니) 05-30 다음 대한체육회 국가대표선수촌, 충북경찰청과 안전한 충북 만들기 위한 업무협약 체결 05-30 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.