阿里萬相2.6發佈:支持“角色扮演”與多分鏡控制，單次視頻時長達15秒

12月16日，阿里巴巴宣佈推出新一代 萬相2.6系列模型，該模型針對專業影視製作和圖像創作場景進行了全面升級，並被稱爲**“全球功能最全的視頻生成模型”。萬相2.6已同步上線阿里雲百鍊和萬相官網**。

萬相2.6系列最大的亮點在於它是國內首個支持“角色扮演”功能的視頻模型，同時支持音畫同步、多鏡頭生成及聲音驅動等功能。

此次升級在畫質、音效、指令遵循等方面進一步提升，並將單次視頻時長提升至國內最高的15秒。該模型家族已支持文生圖、圖像編輯、文生視頻、圖生視頻、人聲生視頻、動作生成、角色扮演及通用視頻編輯等10多種視覺創作能力。

1. 角色扮演功能（國內首創）:

萬相2.6能夠參考輸入視頻中的角色外觀和音色，按照提示詞生成單人、多人、人與物合拍的視頻。在模型結構上，通義萬相集成了多項創新技術，可對參考視頻進行多模態聯合建模與學習，提取主體情緒、姿態、視覺特徵以及音色、語速等聲學特徵，確保全感官全維度的一致性保持與遷移。

2. 專業級分鏡控制:

模型新增分鏡控制功能，可將用戶簡單的提示詞轉換爲多分鏡腳本，生成包含多個鏡頭的連貫敘事視頻。通過高層語義理解，萬相2.6能構建具備完整故事線和敘事張力的專業級多鏡頭段落，並在鏡頭絲滑切換的過程中保持核心主體、場景佈局和環境氛圍的高度一致性。

萬相2.6的角色扮演和分鏡控制功能極大地滿足了專業影視級場景需求。

例如，普通用戶上傳一段個人視頻，輸入科幻懸疑風格的提示詞，萬相2.6僅需幾分鐘就能完成分鏡設計、角色演繹、畫面配音等工作，生成一段鏡頭敘事完整、電影級運鏡的短片，幫助用戶“圓電影主角夢”。

面向廣告設計、短劇製作等專業場景，通過輸入連續提示詞，模型可以生成一段完整敘事的短片，讓人人都能當導演。

阿里曾在今年9月率先在國內發佈音畫同步的視頻生成模型萬相2.5，在權威大模型評測集 LMArena 上，萬相圖生視頻位居國內第一。此次2.6版本的發佈，進一步鞏固了其在國內視頻生成領域的領先地位。

即日起，所有人可直接在萬相官網體驗萬相2.6，企業用戶可通過阿里雲百鍊調用 API。據悉，千問 APP 也將於近期上線該模型，並提供更豐富的玩法。

新一代 AI 視頻生成模型 LTX-2發佈:完整敘事高清視頻一鍵生成