AI 음성인식 정확도 높인다… 넥스브이, 멀티모달 키오스크 기술 특허 취득 작성일 01-09 10 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">음성, 영상 융합 분석으로 키오스크 음성 인식 정확도 향상</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="ffxc2N8BOx"> <figure class="figure_frm origin_fig" contents-hash="486aea44e4901c5fdbd3a215811fab08fa6b2b1c677079fde9cc5132344cee35" dmcf-pid="44MkVj6bEQ" dmcf-ptype="figure"> <p class="link_figure"><img alt="사진=넥스브이" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/09/etimesi/20260109161304852wmjs.png" data-org-width="590" dmcf-mid="Vw12ybHlEM" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/09/etimesi/20260109161304852wmjs.png" width="658"></p> <figcaption class="txt_caption default_figure"> 사진=넥스브이 </figcaption> </figure> <p contents-hash="a1a4eec6bba4a1373527056edf06c14581b423186b230135288aa4b894e1fe5e" dmcf-pid="88REfAPKmP" dmcf-ptype="general">AI 기반 인터랙티브 솔루션 전문기업 넥스브이가 멀티모달 기반의 음성 인식 강화 시스템에 대한 기술 특허를 취득했다고 밝혔다.</p> <p contents-hash="3924092801fb7093a5244ba1b8c7844a24cd80329e9d49f364d1e384de15a683" dmcf-pid="66eD4cQ9m6" dmcf-ptype="general">이번 특허는 키오스크 환경에서 사용자의 음성 정보와 영상 정보를 동시에 분석해 음성 인식의 정확도를 높이는 기술로, 소음이 많은 환경이나 발음이 불명확한 상황에서도 보다 안정적인 음성 인식이 가능하도록 설계된 것이 특징이다.</p> <p contents-hash="dc8cd4395ccc0e9140f051c0cc96d3b3e715b93c814034192c41adba02e9d859" dmcf-pid="PPdw8kx2D8" dmcf-ptype="general">특허 기술에 따르면, 사용자가 키오스크 디스플레이에 표시된 음성 인식 객체를 터치한 상태에서 주문을 진행하면, 시스템은 사용자의 음성 신호와 함께 얼굴 영상 정보를 동시에 수신한다. 이후 음성 분석 프로세스가 시작되며, 음성 신호에 대응하는 문장을 분석해 주요 키워드를 식별한다.</p> <p contents-hash="309f68e3e70654d519ca231fca575b309384c5fbb0fe1b8a4d088666c03982a8" dmcf-pid="QgkyLSNdI4" dmcf-ptype="general">동시에 영상 분석 알고리즘을 활용해 사용자 영상 속 입 모양을 분석하고, 발화 시의 입 움직임을 식별한다. 시스템은 이렇게 도출된 입 모양 정보와 음성 분석을 통해 식별된 키워드를 상호 비교해, 실제 사용자가 발화한 유효 키워드를 최종적으로 판단한다. 이를 통해 잡음이나 주변 환경의 영향을 줄이고, 사용자의 실제 발화를 보다 정확하게 인식할 수 있도록 한다.</p> <p contents-hash="126bbb7b9cd95da8e33de09c811ee182cab0869b8867afaee947021d51c2c34e" dmcf-pid="xaEWovjJOf" dmcf-ptype="general">송환구 넥스브이 연구소장은 “이번 특허는 음성 인식에 영상 정보를 결합한 멀티모달 접근 방식을 통해 키오스크 음성 인터페이스의 한계를 보완한 기술”이라며 “주문 키오스크, 무인 안내 시스템, 공공, 의료, 복지 현장 등 다양한 무인 환경에서 활용 가능성이 높다”고 설명했다.</p> <p contents-hash="1b46f2d82714cc317fb569294443b9fea0b513b75331a22120b7d4097f088094" dmcf-pid="y3zMtPpXmV" dmcf-ptype="general">특히 해당 기술은 고령자나 디지털 취약계층처럼 음성 인식 오류로 인해 키오스크 이용에 어려움을 겪는 사용자 경험을 개선하는 데 기여할 수 있을 것으로 기대된다.</p> <p contents-hash="6ada76a8706ee9f4c885cba9fd5369a60f3fb360432f3a8b1d27ec638ee421c4" dmcf-pid="W0qRFQUZE2" dmcf-ptype="general">한편 넥스브이는 음성 인식, 영상 분석, 자연어 처리 기술을 기반으로 다양한 대화형 키오스크 및 AI 커뮤니케이션 솔루션을 개발해 왔으며, 이번 특허 취득을 통해 멀티모달 인터페이스 기술 분야에서의 기술 경쟁력을 한층 강화하게 됐다.</p> <p contents-hash="3b0260ac6e1fec9d7c2aa013c3d75f024f35b1855856bf426e9aaab2d93fc232" dmcf-pid="YpBe3xu5w9" dmcf-ptype="general">서희원 기자 shw@etnews.com</p> </section> </div> <p class="" data-translation="true">Copyright © 전자신문. 무단전재 및 재배포 금지.</p> 관련자료 이전 조한결, 박신혜·고경표와 환상 호흡 "선배들이 잘 챙겨줘…행복하게 마쳤다" (미쓰홍) 01-09 다음 '왕손 콤플렉스' 이주빈, 안보현 배려에 감동…"손 작아 보이게 각도 맞추며 연기" (주말연석극) 01-09 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.