新興混合 AI 模型 CausVid:幾秒鐘內生成高質量視頻

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 21, 2025

近日，麻省理工學院計算機科學人工智能實驗室（CSAIL）與 Adobe Research 聯合研發的創新性 AI 模型 CausVid 引起了廣泛關注。這一混合模型可以在幾秒鐘內生成高質量視頻，標誌着視頻創作領域的一次重大技術突破。

創新的技術架構

CausVid 的設計理念顛覆了傳統的視頻生成方式。許多現有的 AI 視頻生成模型通常採用逐幀生成的方式，效率較低，且質量容易下降。而 CausVid 則通過結合全序列擴散模型和自迴歸模型，實現了同時處理整個視頻序列的能力。這種創新的混合技術使得視頻生成不僅迅速，而且畫面質量得到保障。

具體而言，CausVid 的 “教師模型” 使用經過訓練的擴散模型，爲更爲簡單的自迴歸系統提供指導。自迴歸系統藉助 “教師” 的知識，能夠準確預測下一幀畫面，從而有效避免了常見的 “錯誤累積” 問題，確保生成的視頻畫面流暢且一致。

多樣化的創作功能

CausVid 的功能強大且靈活，用戶可以通過簡單的文本提示來生成視頻。例如，用戶只需輸入 “生成一個人在過馬路”，就能看到一個生動的場景。而在生成過程中，用戶還可以隨時添加新元素，比如 “他到對面人行道時開始寫筆記”，使得視頻創作更加互動和個性化。

不僅如此，CausVid 還具備將靜態圖片轉化爲動態場景的能力，用戶可以看到靜態的風景照在模型的幫助下，變得栩栩如生。此外，CausVid 還可以用於多種視頻編輯任務，例如爲外語直播生成同步的翻譯視頻，或者在視頻遊戲中快速創建新場景，這使得其應用前景十分廣闊。

優越的性能表現

在多項性能測試中，CausVid 展現了其卓越的能力。研究人員發現，CausVid 能夠生成長達10秒的高清視頻，且其生成速度是其他基準模型如 OpenSORA 和 MovieGen 的100倍，同時在畫質和穩定性方面也取得了顯著優勢。甚至在生成30秒的視頻時，CausVid 依然能夠在質量和一致性上超越同類產品，這意味着它有潛力生成更長時間的視頻，甚至數小時的內容。

儘管 CausVid 已經表現出色，研究團隊表示，未來還有提升的空間。他們希望通過在特定領域數據集上的訓練，使得 CausVid 能夠在更短的時間內生成更高質量的視頻。這一突破不僅會提高視頻生成的效率，還可能帶來更好的用戶體驗。

CausVid 的研發得到了亞馬遜科學中心、光州科技學院、Adobe、谷歌及美國空軍研究實驗室的支持。該模型將於六月在計算機視覺與模式識別會議上進行展示，期待它爲視頻生成技術帶來更多可能性。

項目：https://github.com/tianweiy/CausVid

劃重點:
🌟 CausVid 是一個新開發的混合 AI 模型，能夠在幾秒鐘內生成高質量視頻。
⚡ 它結合了全序列擴散模型和自迴歸模型的優勢，實現快速而一致的視頻輸出。
🚀 CausVid 在生成視頻的速度和質量上均超過了其他現有模型，未來有望實現即時生成。

階躍星辰發佈並開源音樂大模型——音躍ACE-Step

階躍星辰與ACE Studio聯合發佈了開源音樂大模型ACE-Step（中文名:音躍），標誌着音樂創作與生成技術的又一重要突破。ACE-Step是繼語音、視頻、圖片、視覺推理等多模態大模型之後的又一成果，展現了音樂創作與生成的最新進展。

消息稱通義視覺負責人薄列峯離職或加入某大廠新組建多模態團隊

據多方信源透露，阿里巴巴通義實驗室應用視覺團隊負責人薄列峯（職級P10）已於2024年4月30日正式離職，並低調加盟某頭部互聯網公司，出任新設立的多模態模型部副總經理一職。儘管該互聯網公司具體名稱尚未公開，坊間普遍猜測其去向可能是字節跳動或騰訊，但目前相關公司及本人均未作出迴應，尚無法證實具體歸屬。圖源備註:圖片由AI生成，圖片授權服務商Midjourney此次人事變動引發業界關注的另一焦點在於“競業限制”。爆料稱，薄列峯目前常駐美國西雅圖，因而不會受到中國大

Parloa融資1.2億美元，市值突破10億美元，欲擴展企業AI客服平臺

近日，客戶體驗領域的創新公司 Parloa GmbH 宣佈成功融資1.2億美元，使其估值達到10億美元。這筆新資金將用於加速公司在北美和歐洲的擴張，增強其人工智能代理管理平臺，並招聘國際人才。自2018年成立以來，Parloa 專注於爲企業提供 AI 驅動的客戶服務解決方案。Parloa 的 AI 代理管理平臺允許企業通過一個低代碼的界面設計、部署和管理各種溝通渠道上的 AI 客服代理，包括語音、聊天和消息。這一平臺的靈活性極高，企業可以利用現有的技術與系統（如 Salesforce、ServiceNow 和 Zendesk 等）集成

美國IT行業就業狀況變化：AI 職位激增184%，傳統崗位逐漸減少

根據 Janco Associates 的最新數據，美國 IT 行業的失業率在四月份降至4.6%。雖然這一數字表明整體就業情況有所改善，但對許多中級專業人士而言，尤其是那些缺乏人工智能（AI）技能的求職者，面臨的挑戰卻在加劇。隨着 AI 和自動化技術的快速發展，求職市場的需求正在發生顯著變化。在四月份，失業的 IT 人員數量降至119，000人，這一數據在一定程度上反映了公司招聘的選擇性加劇。與傳統 IT 崗位相比，AI、雲計算和網絡安全等領域的招聘需求日益增長。Janco Associates 的首席執行官 Victor J

OpenAI計劃大幅降低與微軟的收入分成比例

據最新報道，OpenAI 已向其投資者透露，計劃在未來幾年的時間裏顯著減少與微軟的收入分享比例。該消息引起了業界的廣泛關注，因爲這可能會對 OpenAI 與微軟之間的合作關係以及雙方的商業模式產生深遠影響。根據報道，到2030年，OpenAI 與微軟之間的收入分成比例將至少下降50%。目前，OpenAI 與微軟的合作主要體現在 Azure 雲計算平臺的使用以及微軟產品中集成 OpenAI 的人工智能技術。隨着 AI 市場的快速發展，OpenAI 顯然希望在收入分配上獲得更多的主動權。這一變化的背後，有可能是 OpenA

Google 高管證實：數據 “偏袒” 自家 AI，拒絕競品獲取搜索數據

在一場備受關注的法庭聽證會上，Google 搜索業務負責人利茲・裏德（Liz Reed）向外界揭示了公司對待人工智能(AI)模型數據請求的態度。她明確表示，儘管 Google 去年已開始向部分 AI 公司開放利用其搜索結果的渠道，但關鍵的搜索數據仍然優先供給自家的 AI 服務 Gemini，這一證詞爲反壟斷監管機構的調查提供了重要支持。近年來，美國司法部對 Google 的反壟斷調查持續升溫，要求該公司共享用於構建搜索結果的大量數據。裏德的證詞指出，Google 並未真正公平對待所有 AI 企業，她承認，付費使