알리바바, AI 비주얼 생성 모델 'Wan 2.6' 시리즈 공개 작성일 12-18 27 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="zubMR4WIOD"> <figure class="figure_frm origin_fig" contents-hash="ced28d8c5eef40d89f861748dd9455849645d35ab9df892581a508915fcb5775" dmcf-pid="q7KRe8YCsE" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/18/etimesi/20251218044007430gzui.png" data-org-width="700" dmcf-mid="71RAcLUZww" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/18/etimesi/20251218044007430gzui.png" width="658"></p> </figure> <p contents-hash="e0d9986cf2e15d1443e4d1fa058022b831ff3c8c5b20934d08153d67f5424697" dmcf-pid="BbfinxZvOk" dmcf-ptype="general">알리바바 클라우드가 인공지능(AI) 비주얼 생성 모델 최신 버전 'Wan 2.6' 시리즈를 17일 공개했다.</p> <p contents-hash="8f83b2a135a1acd1e9ad651e685b3c08466692e52a5f5907836ad87cef76d4f3" dmcf-pid="bK4nLM5Trc" dmcf-ptype="general">Wan 2.6은 크리에이터가 본인 모습과 목소리를 그대로 반영해 AI 생성 영상에 직접 등장하고, 다중 장면을 활용한 유연한 스토리텔링이 가능하도록 지원한다. 다중 인물 간 대화 표현을 고도화하고 영상 재생 시간을 확장, 완성도 있는 콘텐츠 제작 역량과 전문성 강화를 목표로 했다.</p> <p contents-hash="1d4db5ad5d306c957c561c5011721a6ed096b0db4f263b19de6071ea8aaf2499" dmcf-pid="K98LoR1yDA" dmcf-ptype="general">새로운 참조 기반 영상 생성 모델을 비롯해 기존 4개 모델 전반에 대한 종합 업그레이드가 적용됐다. 특히 Wan2.6-R2V(Reference to Video)는 사용자가 외모와 목소리가 포함된 캐릭터 참조 영상을 업로드하고 텍스트 프롬프트를 입력하면 동일한 캐릭터가 등장하는 새로운 장면을 생성할 수 있다.</p> <p contents-hash="a0342586bbfe5bebb0109d2e6a627fa6e1036496af76183d22b2341b1a89f4ee" dmcf-pid="926ogetWIj" dmcf-ptype="general">단일 인물과 동물이나 사물 등 복수의 주체를 동시에 포함한 영상 제작도 가능하다. 원본 참조 영상의 고유한 시각적 특징과 음성을 일관되게 유지한다. 멀티모달 참조 생성 기술을 기반으로 개발된 중국 AI 최초 참조 기반 영상 생성 모델이다.</p> <p contents-hash="5ce7dcd14341917bb9efcf4e191b424659ae22bd9e29ccb98887e8af19cdae95" dmcf-pid="2VPgadFYwN" dmcf-ptype="general">또 텍스트-영상 생성 모델(Wan2.6-T2V), 이미지-영상 생성 모델(Wan2.6-I2V), 이미지 생성 모델(Wan2.6-image·Wan2.6-T2I) 등 기존 4개 모델에 대한 전반적인 성능을 개선했다.</p> <p contents-hash="369efcce53c3f50a9a069584f8293b9ca5385d29ad91a77ad9aa5ffee2f77a4a" dmcf-pid="VfQaNJ3GEa" dmcf-ptype="general">지능형 멀티샷 스토리텔링 기능으로 영상 전반에 걸쳐 시각적 일관성을 유지하면서도 보다 풍부하고 표현력 있는 서사 구현을 지원한다. 오디오·시각 동기화와 오디오 기반 영상 생성 역량도 강화했다.</p> <p contents-hash="319a891904eb42fff3b9dfd32301b1c1835188719d33fd98e3a9370fbf9aac97" dmcf-pid="f4xNji0HDg" dmcf-ptype="general">Wan2.6 시리즈는 최대 15초 길이의 영상 출력을 지원, 크리에이터가 스토리를 보다 확장된 구조로 설계하고 전개할 수 있는 여지를 제공한다. 영화 스타일의 전문가 수준 영상 콘텐츠 제작이 가능하다는 게 알리바바 설명이다. 향후 알리바바 대표 AI 서비스 '큐원'에도 통합될 예정이다.</p> <p contents-hash="eaa9970673e961595a5488a1a359e5bc0a3d2abcc9865e563c8f5cf44bbce71b" dmcf-pid="48MjAnpXOo" dmcf-ptype="general">박종진 기자 truth@etnews.com</p> </section> </div> <p class="" data-translation="true">Copyright © 전자신문. 무단전재 및 재배포 금지.</p> 관련자료 이전 김다미, 1500:1 경쟁률 뚫고 '마녀' 캐스팅…"15개상 수상" [RE:TV] 12-18 다음 캐럴 여왕서 올림픽 여신으로… 케리 “밀라노에서 만나요” 12-18 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.