MS, 음성·이미지 생성형 AI 모델 공개…“최첨단 AI 자립 이룰 것” 작성일 04-03 27 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="HxdfscV75u"> <figure class="figure_frm origin_fig" contents-hash="ac90f23ada089861546cad4559e1b07bb1bd2c241988a64466eeb8dc9ae989f9" dmcf-pid="XMJ4OkfzZU" dmcf-ptype="figure"> <p class="link_figure"><img alt="마이크로소프트" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202604/03/etimesi/20260403072545697mrux.png" data-org-width="300" dmcf-mid="GqgxSmQ9Y7" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202604/03/etimesi/20260403072545697mrux.png" width="658"></p> <figcaption class="txt_caption default_figure"> 마이크로소프트 </figcaption> </figure> <p contents-hash="fc199c3d80d6d51d5190b5f01befdb864b9e35a11095196bfe97b541ea802c1f" dmcf-pid="ZRi8IE4qXp" dmcf-ptype="general">마이크로소프트(MS)가 음성 전사(받아쓰기)와 음성 생성, 이미지 생성 특화 모델 3종을 개발자용으로 공개했다.</p> <p contents-hash="e41856ef26beaf6958ed3e2c5dac806eead0f18549526f9bf40b73a6bcdb0a93" dmcf-pid="5JoQlrPKG0" dmcf-ptype="general">2일(현지시간) 사티아 나델라 MS 최고경영자(CEO)는 링크트인을 통해 “모든 개발자에게 성장하는 MAI(MS AI) 모델 제품군을 제공하게 됐다”며 음성 전사 모델 'MAI-트랜스크라이브-1', 음성 생성 모델 'MAI-보이스-1', 이미지 생성 모델 'MAI-이미지-2' 등을 소개했다.</p> <p contents-hash="bb73a8e4ca92deacf2c90b9e8faad6368ea89c8da98d70cd5117b0d71cac20cb" dmcf-pid="1igxSmQ953" dmcf-ptype="general">MAI-트랜스크라이브-1은 영어와 한국어를 포함한 25개 언어를 인식할 수 있으며, 업계 표준 성능지표(벤치마크)인 '플뢰르'에서 오픈AI·구글 등의 모델을 제치고 가장 낮은 오류율을 보였다. MS는 이 모델이 다국어로 진행되는 회의장이나 시끄러운 카페·콘서트 현장 등에서도 음성을 또렷하게 인식할 수 있다고 강조했다.</p> <p contents-hash="94424de072ce294ed2c8e1bc8694098bdf368ed91971719428ddd49929be6022" dmcf-pid="tnaMvsx25F" dmcf-ptype="general">MAI-보이스-1은 몇 초 길이의 음성 데이터만으로도 맞춤형 음성을 생성할 수 있고, 60초 분량의 오디오를 단 1초만에 만들어낼 수 있다.</p> <p contents-hash="1d2ba26a9d529e48b9d6843d50a36919e0ea5fcab78dc14839d638c0ac54a476" dmcf-pid="FLNRTOMVHt" dmcf-ptype="general">또 MAI-이미지-2는 성능지표 최상위권의 이미지를 낮은 가격에 만들 수 있는 가격 대비 성능비를 강점으로 내세웠다.</p> <p contents-hash="bef632531bf2f92379ba9cd26682c2024fe83ab585db52ee6e70d05355bd8326" dmcf-pid="3ojeyIRf51" dmcf-ptype="general">MS는 지난해부터 딥마인드 공동창업자 출신인 무스타파 술레이만 MAI 부문 CEO에게 인간을 능가하는 '초지능' 연구·개발을 맡겼다. 다만, 아직 경쟁사 수준의 범용 기반 모델(파운데이션 모델)을 완성하지는 못한 상황이다.</p> <p contents-hash="31ea875be063be29a3701abb6590c12720468b8df4af987c776316e7d257deae" dmcf-pid="0gAdWCe4Z5" dmcf-ptype="general">이와 관련해 술레이만 CEO는 이날 블룸버그 통신에 “우리는 절대적인 최첨단 기술을 내놔야 하고, 확실히 2027년까지는 최고 수준에 도달하는 것이 목표”라며 “나델라 CEO도 최근 사내 개발자 모임에서 3∼5년 내 최첨단 AI 자립의 중요성을 강조했다”고 설명했다.</p> <p contents-hash="f8a7a1cce0f84ec8b6c860b14bbc8e6bcc113586d8bf9f9fe4ddafccd6e0f82d" dmcf-pid="pacJYhd8ZZ" dmcf-ptype="general">강성전 기자 castlekang@etnews.com</p> </section> </div> <p class="" data-translation="true">Copyright © 전자신문. 무단전재 및 재배포 금지.</p> 관련자료 이전 ‘살림남’ 은지원X롱샷 률, 드디어 만난 도플갱어…지드래곤도 ‘좋아요’ 04-03 다음 ‘무명전설’ 이도진, 김한율 응원 04-03 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.