在2024年世界人工智能大會(WAIC)上,商湯科技推出的可控人物視頻生成大模型——Vimi。Vimi模型利用商湯先進的大模型技術,能夠通過單張照片生成與目標動作一致的人物視頻,實現精準的表情和肢體控制。該模型支持多種驅動方式,包括視頻、動畫、聲音和文字,具有多年積累的面部跟蹤技術和對細節的精確控制能力,能夠生成高一致性、光影和諧的視頻內容。

Vimi的穩定性尤爲突出,能夠生成長達1分鐘以上的單鏡頭人物視頻,且畫面效果不會隨時間劣化。它還能根據人物動作調整環境場景,模擬鏡頭角度變化和頭髮抖動,提供逼真的視覺效果。此外,Vimi還支持光影變化模擬,爲視頻創作者提供豐富的創作自由度。

微信截圖_20240709140907.png

Vimi相機作爲基於Vimi大模型的首款C端應用,主要面向廣大女性用戶,滿足她們的娛樂創作需求。用戶上傳不同角度的高清人物圖片後,Vimi相機能自動生成數字分身和不同風格的寫真視頻,提供多樣化的生成風格。Vimi相機還支持通過單張圖片生成趣味人物表情包,玩法多樣,實現個性化創作。

目前,Vimi相機正開放內測,感興趣的用戶可以通過關注公衆號並填寫預約鏈接申請體驗。