騰訊開源的一致性視頻生成工具 “HunyuanCustom”,該模型不僅能生成生動的視頻內容,還能實現音頻與口型的同步。這一創新技術的發佈,標誌着在深度僞造視頻領域的一次重要進步。

 一圖生成,深度僞造不再遙遠

HunyuanCustom 的最大亮點在於用戶只需提供一張圖像,就能創造出深度僞造風格的視頻。這一功能可以簡化視頻製作流程,用戶不再需要多張圖片作爲參考,極大地提升了視頻內容生成的便利性。

HunyuanCustom 不僅限於簡單的視頻生成。該模型還具備處理多種場景的能力,包括單一角色的模擬和虛擬試穿。用戶可以將單個角色與不同的物體結合,創造出豐富多樣的場景。這一特性將爲遊戲開發、虛擬試衣等領域帶來新的可能性。

QQ_1746760828673.png

音頻同步,提升沉浸感

在音頻方面,HunyuanCustom 利用了複雜的 LatentSync 系統,實現了音頻與口型的精準同步。這一技術的實現,使得視頻中的角色在說話時,其嘴部動作與發出的聲音完美匹配,從而提升了觀衆的沉浸感和真實性。

雖然目前尚未推出英文示例,但已有的展示效果表明,該技術的表現相當優秀,未來有望在更多語言中得到應用。

視頻編輯,拓展應用邊界

HunyuanCustom 還具備強大的視頻編輯功能。通過視頻到視頻(V2V)編輯,用戶可以智能地替換現有視頻中的部分內容,僅需一張參考圖像即可完成。這一功能爲用戶提供了更多創意空間,使得視頻編輯過程更加簡便高效。

在演示中,可以看到系統如何通過遮罩技術,僅對目標對象進行替換,而不影響周圍環境,達到了良好的整合效果。這一特性將吸引大量創作者探索其在內容製作中的應用。

HunyuanCustom 的推出,爲深度僞造技術的應用開闢了新的視野。儘管在某些方面仍有提升空間,但其獨特的功能和應用潛力無疑將推動視頻製作的創新。隨着這一技術的進一步發展,我們期待在創意產業中見證更多精彩的作品。

官網:https://aivideo.hunyuan.tencent.com/