快手近日發佈了名爲 CineMaster 的全新文本到視頻生成框架,該框架具備3D 感知能力,被譽爲視頻版本的 ControlNet。據悉,CineMaster 允許用戶通過多種控制信號精確控制生成視頻中物體的位置和相機運動,帶來前所未有的創作自由度。

CineMaster 的核心優勢在於其強大的控制能力。用戶不僅可以通過傳統的文本提示來生成視頻,還能結合以下控制信號進行精細調整:

深度圖:用於控制場景的深度信息和物體的空間關係。

相機軌跡: 精確指定視頻中相機的運動路徑,實現各種複雜的鏡頭效果。

物體標籤:用於標記和控制特定物體在場景中的位置和行爲。

通過這些控制信號的組合,用戶可以實現對生成視頻內容的精準把控,創作出更具創意和個性化的作品。

此外,快手還提供了一套從大規模視頻中提取3D 邊界框和相機軌跡的流程,爲 CineMaster 的訓練和應用提供了強大的數據支持。

CineMaster 的項目頁面已上線,感興趣的用戶可以訪問cinemaster-dev.github.io/。