Video-Infinity：用多個GPU快速生成長視頻 5分鐘內生成95秒長度

新加坡國立大學的 Learning and Vision Lab 團隊最近開發了一款名爲 Video-Infinity 的分佈式長視頻生成工具。該工具能夠利用多個 GPU 快速生成長視頻，無需對現有模型進行額外訓練，每5分鐘即可產生95秒長度的2300幀視頻。

產品入口：https://top.aibase.com/tool/video-infinity

這款工具具有分佈式、高速和免訓練等特點，採用 conda 環境進行安裝，使用簡便。用戶可以根據需要進行基本配置、流水線配置和 Video-Infinity 配置，以實現不同的視頻生成需求。

同時，爲了避免高頻信息丟失，建議將本地上下文幀數量與 Attention 模型的全局上下文幀數量之和設置在24以下，以保持視頻質量和穩定性。

通過對比實驗結果，該技術不僅在視頻幀數上具有明顯優勢，而且在時間成本上也表現出色。技術團隊表示，他們的方法在8個 Nvidia Ada6000GPU 的支持下實現了這一成就，而且採用的採樣步驟設置爲30。

該技術的研究人員還進行了對抗實驗，通過消融分析 Clip Parallelism 和 Dual-scope Attention 的效果，結果顯示這兩個因素對視頻生成具有顯著影響。此外，該技術還支持多個提示（Multi-Prompts），可以實現背景、風格和主題的平滑過渡，爲視頻生成提供了更多可能性。

劃重點:
⭐️ 該技術能在5分鐘內生成具有2300幀的視頻，比先前方法快100倍;
⭐️ Clip Parallelism 和 Dual-scope Attention 對視頻生成具有顯著影響;
⭐️ 支持多個提示（Multi-Prompts），可以實現平滑過渡。

騰訊開源多語言翻譯“利器”Hy-MT2，輕量版僅440MB可本地運行，小程序已上線

騰訊混元近日開源多語言翻譯模型Hy-MT2，並同步推出“騰訊Hy翻譯”小程序。該模型家族包含三種尺寸，支持33種語言互譯及5種民族語言/方言翻譯。其中，輕量級Hy-MT2-1.8B採用自研AngelSlim 1.25-bit極端量化技術，專爲移動端優化，兼顧高質量與高效率。

騰訊會議推出 AI 同傳功能：實時翻譯時延低至 3 秒

騰訊會議正式上線AI同傳功能，首次向所有用戶開放中英文實時翻譯，旨在提升跨國會議及遠程協作的溝通效率。該功能將翻譯時延控制在3秒以內，實現發言與翻譯幾乎同步，有效解決傳統同傳中的延遲和斷檔問題，幫助參會者更順暢對話，避免信息遺漏和誤解。

Video-Infinity：用多個GPU快速生成長視頻 5分鐘內生成95秒長度

相關推薦

Cursor 重回巔峯！全新 Composer 2.5 挑戰 Claude，定價僅爲十分之一！

騰訊開源多語言翻譯“利器”Hy-MT2，輕量版僅440MB可本地運行，小程序已上線

赴港IPO前奏：月之暗面正式啓動VIE架構拆除，衝刺 200 億美元資本市場

谷歌 Android 版 AI 編程工具，助力用戶輕鬆創建應用

騰訊會議推出 AI 同傳功能：實時翻譯時延低至 3 秒

Video-Infinity：用多個GPU快速生成長視頻 5分鐘內生成95秒長度

相關推薦

Cursor 重回巔峯！全新 Composer 2.5 挑戰 Claude，定價僅爲十分之一！

騰訊開源多語言翻譯“利器”Hy-MT2，輕量版僅440MB可本地運行，小程序已上線

赴港IPO前奏：月之暗面正式啓動VIE架構拆除，衝刺 200 億美元資本市場

谷歌 Android 版 AI 編程工具，助力用戶輕鬆創建應用

​騰訊會議推出 AI 同傳功能：實時翻譯時延低至 3 秒

騰訊會議推出 AI 同傳功能：實時翻譯時延低至 3 秒