在Vidu上線逾百日之際,生數科技自豪地宣佈Vidu1.5新版本的問世,該版本實現了世界領先水平的突破,特別是在理解多樣化輸入和突破“一致性”難題方面。

Vidu1.5的推出標誌着視覺模型進入了全新的“上下文”時代,加速了通用人工智能(AGI)的到來。Vidu在全球上線之初便具備了角色一致性生成能力,通過鎖定人物面部特徵解決了視頻生成中的關鍵痛點。9月份,Vidu全球率先發布了“主體一致性”功能,將面部一致性拓展至全身一致性,並將範圍擴展到動物、物體、虛擬角色等任意主體。Vidu的技術突破主要體現在三個方面:複雜主體的精準控制、人物面部特徵和動態表情的自然一致性、多主體一致性。

微信截圖_20241113135537.png

微信截圖_20241113135531.png

Vidu1.5展現了視覺模型全新的“智能涌現”,展示了其強大的上下文學習能力。這意味着視覺模型不僅具備了理解和想象的能力,還能夠在生成過程中進行記憶管理。Vidu1.5延續了其業界領先的生成效率,不到30秒即可生成一段視頻。Vidu秉承通用性的理念,與LLM(大型語言模型)一致的設計哲學,將所有問題統一爲視覺輸入和視覺輸出的問題,使用單個Transformer統一建模變長的輸入和輸出,並從視頻數據的壓縮中獲取智能。

Vidu1.5的推出,不僅提升了視頻模型的可控性,還通過靈活的多元輸入實現了多角度、多主體、多元素的一致性生成。這標誌着視覺智能的涌現,加速了AGI的到來。Vidu不再僅僅是一個高質量、高效的視頻生成器,它還能在生成過程中融入上下文信息和記憶,這是視覺模態智能的“大跨越”。視覺模型將具備更強的認知能力,成爲AGI的一塊重要拼圖。

體驗地址:www.vidu.studio