2025年1月22日,上海階躍星辰智能科技有限公司宣佈其視頻生成模型 Step-Video 正式升級至 V2版本。此次升級帶來了顯著的技術突破和功能提升,使其在真實世界模擬方面更加強大。

Step-Video V2版本在多個核心技術領域進行了優化和創新。首先,該版本採用了壓縮比更高的 VAE 模型,通過空間和時間的高效壓縮,在保證重構質量的同時,顯著降低了計算複雜度,提升了生成效率。其次,Step-Video V2對 DiT 架構進行了深度優化,並引入強化學習算法,進一步提升了視頻生成的流暢性和細節表現力。此外,該版本還結合了自研的多模態理解大模型和視頻知識庫,能夠更精準地描述視頻內容和鏡頭語言,生成更貼近真實世界的視頻。

微信截圖_20250123090916.png

在實際應用中,Step-Video V2展現出了強大的複雜運動生成能力,無論是芭蕾舞、空手道,還是羽毛球等場景,都能流暢地呈現動態畫面。同時,該模型在人物表情捕捉方面表現出色,能夠細膩地呈現真實人物或虛構角色的神態和光影效果。此外,Step-Video V2還支持豐富的鏡頭語言,包括推、拉、搖、移等多種運動方式,以及不同景別之間的切換,爲視頻創作提供了更多可能性。

值得一提的是,Step-Video V2新增了基礎文字生成功能,能夠將文字自然融入視頻內容,生成效果顯著優於前代模型。這一功能的加入,進一步拓展了視頻生成的應用場景。

目前,Step-Video V2已在躍問網頁端(https://yuewen.cn/videos)開放試用申請,用戶可以體驗這一升級後的強大功能。

此次升級不僅標誌着階躍星辰在視頻生成領域的技術進步,也爲創作者提供了更強大的工具,推動視頻創作進入新的階段。