12月16日,阿里巴巴宣佈推出新一代 萬相2.6系列模型,該模型針對專業影視製作和圖像創作場景進行了全面升級,並被稱爲**“全球功能最全的視頻生成模型”。萬相2.6已同步上線阿里雲百鍊和萬相官網**。
萬相2.6系列最大的亮點在於它是國內首個支持“角色扮演”功能的視頻模型,同時支持音畫同步、多鏡頭生成及聲音驅動等功能。
核心升級與技術突破
此次升級在畫質、音效、指令遵循等方面進一步提升,並將單次視頻時長提升至國內最高的15秒。該模型家族已支持文生圖、圖像編輯、文生視頻、圖生視頻、人聲生視頻、動作生成、角色扮演及通用視頻編輯等10多種視覺創作能力。
1. 角色扮演功能(國內首創):
萬相2.6能夠參考輸入視頻中的角色外觀和音色,按照提示詞生成單人、多人、人與物合拍的視頻。在模型結構上,通義萬相集成了多項創新技術,可對參考視頻進行多模態聯合建模與學習,提取主體情緒、姿態、視覺特徵以及音色、語速等聲學特徵,確保全感官全維度的一致性保持與遷移。
2. 專業級分鏡控制:
模型新增分鏡控制功能,可將用戶簡單的提示詞轉換爲多分鏡腳本,生成包含多個鏡頭的連貫敘事視頻。通過高層語義理解,萬相2.6能構建具備完整故事線和敘事張力的專業級多鏡頭段落,並在鏡頭絲滑切換的過程中保持核心主體、場景佈局和環境氛圍的高度一致性。

賦能影視級創作場景
萬相2.6的角色扮演和分鏡控制功能極大地滿足了專業影視級場景需求。
例如,普通用戶上傳一段個人視頻,輸入科幻懸疑風格的提示詞,萬相2.6僅需幾分鐘就能完成分鏡設計、角色演繹、畫面配音等工作,生成一段鏡頭敘事完整、電影級運鏡的短片,幫助用戶“圓電影主角夢”。
面向廣告設計、短劇製作等專業場景,通過輸入連續提示詞,模型可以生成一段完整敘事的短片,讓人人都能當導演。
延續國內領先地位
阿里曾在今年9月率先在國內發佈音畫同步的視頻生成模型萬相2.5,在權威大模型評測集 LMArena 上,萬相圖生視頻位居國內第一。此次2.6版本的發佈,進一步鞏固了其在國內視頻生成領域的領先地位。
即日起,所有人可直接在萬相官網體驗萬相2.6,企業用戶可通過阿里雲百鍊調用 API。據悉,千問 APP 也將於近期上線該模型,並提供更豐富的玩法。
