近日,阿里巴巴宣佈視頻生成模型WanX2.1將全面開源,同時公佈了最新視頻效果。

2025年1月,阿里巴巴旗下通義萬相團隊推出Wanx2.1多模態大模型,憑藉其在視頻生成領域的突破性進展,榮登VBench評測榜單首位,重新定義了AI驅動的視覺創作標準。WanX 團隊[昨晚宣佈即將開源其最新的 WANX2.1視頻生成模型。

據悉,Wanx2.1首次攻克了AI視頻模型中長期存在的文字生成難題,成爲全球首個支持中英文文字特效的模型。用戶僅需輸入文本指令即可生成動態視頻,並搭配多樣化的過渡、粒子等特效。此外,通過自研的高效VAE與DiT架構,模型實現了無限長1080P視頻的高效編解碼,顯著提升了時空上下文建模能力。

在物理規律模擬方面,Wanx2.1能夠精準還原碰撞、反彈、切割等複雜場景。例如,生成“雨滴落在傘面濺起水花”或“花樣滑冰運動員旋轉”的視頻時,肢體協調性和運動軌跡均符合真實物理規律,有效解決了傳統模型肢體扭曲、動作僵硬的問題。