正文

生數科技視頻生成模型Vidu 1.5版發佈攻克“多主體一致性”難題

發布於AI新閒資訊

時間 :Nov 13, 2024

閱讀 :1分鐘

在Vidu上線逾百日之際，生數科技自豪地宣佈Vidu1.5新版本的問世，該版本實現了世界領先水平的突破，特別是在理解多樣化輸入和突破“一致性”難題方面。

Vidu1.5的推出標誌着視覺模型進入了全新的“上下文”時代，加速了通用人工智能（AGI）的到來。Vidu在全球上線之初便具備了角色一致性生成能力，通過鎖定人物面部特徵解決了視頻生成中的關鍵痛點。9月份，Vidu全球率先發布了“主體一致性”功能，將面部一致性拓展至全身一致性，並將範圍擴展到動物、物體、虛擬角色等任意主體。Vidu的技術突破主要體現在三個方面:複雜主體的精準控制、人物面部特徵和動態表情的自然一致性、多主體一致性。

微信截圖_20241113135537.png

微信截圖_20241113135531.png

Vidu1.5展現了視覺模型全新的“智能涌現”，展示了其強大的上下文學習能力。這意味着視覺模型不僅具備了理解和想象的能力，還能夠在生成過程中進行記憶管理。Vidu1.5延續了其業界領先的生成效率，不到30秒即可生成一段視頻。Vidu秉承通用性的理念，與LLM（大型語言模型）一致的設計哲學，將所有問題統一爲視覺輸入和視覺輸出的問題，使用單個Transformer統一建模變長的輸入和輸出，並從視頻數據的壓縮中獲取智能。

Vidu1.5的推出，不僅提升了視頻模型的可控性，還通過靈活的多元輸入實現了多角度、多主體、多元素的一致性生成。這標誌着視覺智能的涌現，加速了AGI的到來。Vidu不再僅僅是一個高質量、高效的視頻生成器，它還能在生成過程中融入上下文信息和記憶，這是視覺模態智能的“大跨越”。視覺模型將具備更強的認知能力，成爲AGI的一塊重要拼圖。

體驗地址:www.vidu.studio

DeepSeek V4 降價，寧德時代等巨頭爭相投資 AGI 夢想近在咫尺！

5月23日，DeepSeek宣佈V4-Pro API自6月1日起永久降價至原價的四分之一，旨在吸引更多開發者，彰顯其在AI領域的堅定決心。同時，公司正迎來融資熱潮，寧德時代、京東、網易等大企業紛紛接洽，意圖拓展AI數據中心電力設備等市場。

May 25, 2026

169.5k

宇樹科技發佈全球首款量產載人變形機甲GD01，起售價390萬元

宇樹科技5月12日發佈全球首款量產版載人變形機甲GD01，售價390萬元起。該產品實現雙足與四足模式無縫切換，載人總重約500kg，動力可擊倒磚牆，標誌着人形機器人與AGI技術從實驗室步入民用量產市場。

May 12, 2026

250.2k

影視颶風 Tim 大膽預測：通 AI 問世後或將導致全員失業

影視颶風Tim與作家餘華直播對談時預測，通用人工智能（AGI）問世將導致所有人失業。他指出，儘管自動駕駛技術引發擔憂，但五年內其落地尚有限，而AGI的全面影響可能更深遠，引發對大規模失業的廣泛討論。

May 11, 2026

272.6k

Google DeepMind入股CCP Games，EVE Online成爲通用人工智能實驗場

Google DeepMind收購《EVE Online》開發商CCP Games少數股權，將其虛擬世界納入AI測試體系。CCP Games以1.2億美元從韓國Pearl Abyss回購自身並更名爲Fenris Creations，交易價格較2018年估值大幅縮水。此次合作旨在爲通用人工智能（AGI）提供沙箱環境。

May 8, 2026

209.8k

魔形智能完成數億元Pre-A輪融資，佈局Token基礎設施

魔形智能完成數億元Pre-A輪融資，由達泰資本領投，多家機構跟投，老股東持續加碼。公司成立兩年完成三輪融資，定位AGI的Token基礎設施提供商，核心產品助力人工智能發展。

May 6, 2026

178.1k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご