商湯科技正式推出了其首個具有里程碑意義的“Vimi”可控人物視頻生成大模型。
Vimi作爲商湯科技基於其強大的日日新大模型能力研發的產物,實現了前所未有的視頻生成靈活性。它能夠靈活接收來自動作視頻、精美動畫、豐富聲音素材乃至文字描述的多元化輸入,作爲驅動元素,精準地操控並轉化人物類圖片,最終生成與目標動作完美匹配的人物視頻。這一過程不僅展現了AI技術對於複雜場景的高度適應性,也體現了商湯在視頻生成技術上的深厚積累。
尤爲值得一提的是,Vimi在可控性上的卓越表現。它超越了傳統圖片表情控制技術的侷限,不僅能夠細膩地調整人物的表情變化,更實現了對肢體動作的精準操控。這一突破性的能力使得Vimi能夠生成出既符合邏輯又生動自然的視頻內容,同時,在頭髮、服飾、背景等細節處理上也達到了前所未有的精細度,支持光影的自然變化,爲觀衆帶來沉浸式的視覺體驗。
在視頻生成的穩定性與時長上,Vimi同樣展現出了非凡的實力。它能夠穩定地生成長達1分鐘的單鏡頭人物視頻,這一成就突破了現有大模型AI視頻生成在時長上的限制。更重要的是,隨着視頻時長的增加,Vimi生成的視頻畫面質量始終保持如一,不會出現劣化或失真的情況,確保了視頻內容的連貫性和高質量。
申請體驗地址:https://www.wjx.cn/vm/mhSxfGv.aspx