加速視頻生成新方法PAB：可實時生成視頻每秒21.6幀

近日，新加坡國立大學和普渡大學的研究人員成功提PAB技術，實現了基於擴散式轉換的視頻生成的實時處理。

產品入口：https://top.aibase.com/tool/pab

這項技術是基於 Diffusion Transformer（DiT）的視頻生成模型的首次嘗試，通過減少冗餘的關注計算，實現了高達21.6幀每秒的生成速度，加速了10.6倍，而且在不犧牲質量的情況下適用於多個熱門的 DiT 視頻生成模型，包括 Open-Sora、Open-Sora-Plan 和 Latte。PAB 是一種無需訓練的方法，可以爲未來的 DiT 視頻生成模型賦予實時生成的能力。PAB 無需經過訓練，能夠賦予未來任何基於擴散式轉換的視頻生成模型實時處理的能力。

重要功能特點：

PAB關注廣播通過減少冗餘的關注計算，顯著提高了視頻生成的速度，實現了實時生成。
根據關注的穩定性和差異性，PAB 爲不同類型的關注設置了不同的廣播範圍，從而在保證計算效率的同時最小化了質量損失。
通過改進序列並行處理技術，PAB 減少了多 GPU 之間的通信開銷，進一步提高了視頻生成的速度和效率。

研究人員發現，視頻擴散式轉換模型中的注意力機制存在着明顯的時間步驟間的差異，通過這一發現，提出了PAB以減輕不必要的注意力計算。在穩定的中間部分，PAB 將一個擴散步驟的注意力輸出廣播到後續的多個步驟，從而顯著減少了計算成本。此外，爲了更高效的計算和最小化質量損失，針對不同的注意力類型設置了不同的廣播範圍。

爲了進一步提高視頻生成速度，研究人員改進了基於動態序列並行（DSP）的並行處理方法，通過廣播時間注意力，消除了大部分通信開銷，實現了超過50% 的通信開銷降低，爲實時視頻生成提供了更加高效的分佈式推斷能力。

劃重點:
⭐ PAB技術實現了實時視頻生成，加速了10.6倍的處理速度。
⭐ 通過觀察視頻擴散式轉換模型的注意力機制差異，提出了 PAB 以減輕不必要的注意力計算。
⭐ 通過改進並行處理方法，大幅降低了通信開銷，爲實時視頻生成提供了更高效的分佈式推斷能力。

黑森林實驗室FLUX3 多模態模型登場：單次生成 20 秒音視頻，勝率碾壓Grok與Seedance

Black Forest Labs發佈FLUX3多模態基礎模型，採用統一架構聯合學習圖像、視頻和音頻。基於Self-Flow自監督流匹配框架，在FLUX系列基礎上擴展多模態生成與理解。支持文生視頻、圖生視頻，單次生成最長20秒視頻並原生輸出同步音頻，性能全面超越前代。

紅果短劇發佈AI角色規範，專項整治“高頻AI臉”與素材侵權

7月24日，紅果短劇發佈公告，規範AI劇角色創作：要求單部劇主要角色具備高辨識度，禁止複用高度相似形象，以緩解審美疲勞、降低高頻AI臉使用。版權方面，未經授權不得使用他人獨創性角色、服裝道具設計，並嚴禁盜用有著作權寫真。

菲爾茲獎新得主齊默爾曼官宣加入OpenAI，數學最高榮譽得主轉向AI安全

2026年國際數學家大會在費城開幕，本屆菲爾茲獎授予鄧煜、約翰·帕登、雅各布·齊默爾曼與王虹。鄧煜和王虹成爲首位獲此殊榮的中國籍數學家。齊默爾曼因攻克o-極小性理論核心猜想獲獎，會後宣佈轉向AI安全研究並加入OpenAI，其數學天賦獲高度評價。

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

Runway推出Media Router，可依據質量、速度與成本優先級，爲圖像、視頻、音頻生成自動切換AI模型。系統將調用場景分爲三類，如高速生成模式用於快速創意驗證，實現智能匹配，省去開發者逐一比較和手動切換的負擔，兼顧效率與成本。

加速視頻生成新方法PAB：可實時生成視頻每秒21.6幀

相關推薦

Kimi K3 攻防考卷翻車：漏洞利用只到美國前沿模型四成，蒸餾疑雲被安全機構擺上臺

黑森林實驗室FLUX3 多模態模型登場：單次生成 20 秒音視頻，勝率碾壓Grok與Seedance

紅果短劇發佈AI角色規範，專項整治“高頻AI臉”與素材侵權

菲爾茲獎新得主齊默爾曼官宣加入OpenAI，數學最高榮譽得主轉向AI安全

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

加速視頻生成新方法PAB：可實時生成視頻 每秒21.6幀

相關推薦

Kimi K3 攻防考卷翻車：漏洞利用只到美國前沿模型四成，蒸餾疑雲被安全機構擺上臺

黑森林實驗室FLUX3 多模態模型登場：單次生成 20 秒音視頻，勝率碾壓Grok與Seedance

紅果短劇發佈AI角色規範，專項整治“高頻AI臉”與素材侵權

菲爾茲獎新得主齊默爾曼官宣加入OpenAI，數學最高榮譽得主轉向AI安全

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

加速視頻生成新方法PAB：可實時生成視頻每秒21.6幀