正文

通義萬相推2.1視頻模型大幅提升複雜運動能力

發布於AI新閒資訊

時間 :Jan 9, 2025

閱讀 :1分鐘

近日，阿里旗下的通義萬相視頻生成模型迎來了重磅升級，推出了全新的2.1版本。這一版本分爲極速版與專業版，分別着重於高效性能和卓越表現力，爲 AI 視頻生成帶來了新的突破。

此次升級最引人注目的是模型在處理複雜運動和還原真實物理規律方面的顯著進步，尤其是在提升視頻的電影質感和優化指令遵循能力上。新的模型讓 AI 藝術創作的可能性大大增加，爲用戶提供了更多創作空間。

在實際應用中，通義萬相的表現也相當驚豔。比如我讓通義生成一個小貓切黃瓜的畫面，可以看到，視頻很連貫地展示了小貓在廚房切黃瓜的畫面，刀鋒緩緩切入，黃瓜片片掉落。細節上要比之前的視頻模型生成效果好很多。

此外，通義萬相的最新版本還成功解決了以往 AI 視頻生成中常見的 “鬼畫符” 問題，首次實現了中英文文字的精準生成。例如，一個小貓在鍵盤前打字，屏幕上跳出 “沒飯吃” 這樣的字幕，充滿了幽默感。它還能夠在各種場景中實現特效字體的應用，給視頻增添了更多創意。

在複雜人物運動方面，通義萬相也展現出了強大的能力。無論是滑雪的女孩，還是奔跑的男子，動作都流暢自然，遵循了真實的物理規律。AI 生成的視頻不僅畫面生動，細節真實，還能模擬出令人信服的運動效果。

值得一提的是，這次升級還使得通義萬相在運鏡方面表現得如同電影大師。在輸入簡單的指令後，系統能夠自動調整鏡頭，產生聚焦與拉遠等效果，極大地提升了視頻的藝術性。比如，一場搖滾樂隊的演出通過鏡頭的推進，突出了吉他手的神態，令人彷彿置身於演出現場。

通義萬相2.1版本的重磅升級，不僅提升了視頻生成的技術水平，也爲用戶提供了更爲豐富的創作工具，標誌着 AI 視頻生成技術的新篇章。

官網地址：https://tongyi.aliyun.com/wanxiang/videoCreation

可靈AI 獲 30 億美元融資，估值達 180 億美元創視頻大模型融資紀錄

7月2日，快手可靈AI獲近30億美元融資，投後估值達180億美元，刷新全球視頻大模型融資紀錄。本輪由CPE源峯、國方創投、BlueFive、騰訊、中關村科學城基金、中信證券聯合領投，標誌其獨立商業化正式啓航。

快手旗下AI視頻生成平臺“可靈AI”被傳即將完成首輪獨立融資，規模達30億美元，投後估值約180億美元。儘管快手未予置評，該消息已引發市場高度關注。該平臺自2026年5月傳出分拆消息以來，其估值預期始終處於震盪博弈之中。

AI音樂視頻平臺“立刻MV”發佈1.1版本，同步上線網頁與iPhone端。新版本核心升級在於引入AI視頻生成模塊，直接輸出動態視頻，取代傳統“圖片幻燈片式”處理，顯著提升視頻生成的表現力與靈活性，降低MV製作門檻。

xAI發佈Grok Imagine Video1.5預覽版，進軍AI視頻生成賽道。該模型可將單張靜態圖片轉換爲短視頻，支持720p分辨率輸出。用戶上傳圖片後，通過文本提示描述鏡頭運動、畫面節奏和氛圍，模型能保留原始圖像細節、光影和風格，生成自然流暢的動態視頻。

字節跳動視覺技術前負責人王長虎創立愛詩科技，憑藉高效團隊和快速技術迭代，在六個月內獲25億元融資，公司估值達10億美元，躋身獨角獸行列。他帶領團隊在巨頭林立的AI視頻生成賽道中突圍，展現了“速度與激情”式的創業精神，成爲“字節系”創業者的領軍人物。

智啟未來，您的人工智能解決方案智庫