近日,阿里旗下的通義萬相視頻生成模型迎來了重磅升級,推出了全新的2.1版本。這一版本分爲極速版與專業版,分別着重於高效性能和卓越表現力,爲 AI 視頻生成帶來了新的突破。

此次升級最引人注目的是模型在處理複雜運動和還原真實物理規律方面的顯著進步,尤其是在提升視頻的電影質感和優化指令遵循能力上。新的模型讓 AI 藝術創作的可能性大大增加,爲用戶提供了更多創作空間。
在實際應用中,通義萬相的表現也相當驚豔。比如我讓通義生成一個小貓切黃瓜的畫面,可以看到,視頻很連貫地展示了小貓在廚房切黃瓜的畫面,刀鋒緩緩切入,黃瓜片片掉落。細節上要比之前的視頻模型生成效果好很多。
此外,通義萬相的最新版本還成功解決了以往 AI 視頻生成中常見的 “鬼畫符” 問題,首次實現了中英文文字的精準生成。例如,一個小貓在鍵盤前打字,屏幕上跳出 “沒飯吃” 這樣的字幕,充滿了幽默感。它還能夠在各種場景中實現特效字體的應用,給視頻增添了更多創意。
在複雜人物運動方面,通義萬相也展現出了強大的能力。無論是滑雪的女孩,還是奔跑的男子,動作都流暢自然,遵循了真實的物理規律。AI 生成的視頻不僅畫面生動,細節真實,還能模擬出令人信服的運動效果。

值得一提的是,這次升級還使得通義萬相在運鏡方面表現得如同電影大師。在輸入簡單的指令後,系統能夠自動調整鏡頭,產生聚焦與拉遠等效果,極大地提升了視頻的藝術性。比如,一場搖滾樂隊的演出通過鏡頭的推進,突出了吉他手的神態,令人彷彿置身於演出現場。
通義萬相2.1版本的重磅升級,不僅提升了視頻生成的技術水平,也爲用戶提供了更爲豐富的創作工具,標誌着 AI 視頻生成技術的新篇章。
官網地址:https://tongyi.aliyun.com/wanxiang/videoCreation
