Stability AI發佈單一視頻轉換多視圖視頻的生成模型：Stable Video 4D

近日，Stability AI公司宣佈推出一項革命性的視頻處理技術——Stable Video4D。該技術能夠將單一視角的視頻轉換成8個不同角度的新視角視頻，爲創作者提供了前所未有的靈活性和創造力。

Stable Video4D建立在該公司此前推出的Stable Video Diffusion模型基礎之上。與將圖像轉換爲視頻不同，新模型可以接收視頻輸入，並生成多個新視角的視頻輸出，實現了從基於圖像的視頻生成向全3D動態視頻合成的重大飛躍。

使用時，用戶只需上傳一段視頻並指定所需的3D攝像機位置，Stable Video4D即可生成8個新視角的視頻，爲用戶提供全方位的多角度視角。目前，該模型可以在大約40秒內生成8個視角的5幀視頻，整個4D優化過程約需20-25分鐘。

與之前的方法相比，Stable Video4D能夠同時生成多個新視角視頻，大大提高了空間和時間軸上的一致性。這不僅確保了物體在多個視角和時間戳上的一致性，還實現了更輕量級的4D優化框架。

Stability AI表示，Stable Video4D目前處於研究階段，未來有望在遊戲開發、視頻編輯和虛擬現實等領域得到廣泛應用。該公司正在積極優化模型，以處理更廣泛的真實世界視頻。

Stable Video4D現已在Hugging Face平臺上開放使用。Stability AI期待通過持續的研究和開發，進一步提升這項技術創建逼真多角度視頻的潛力。該公司將繼續與研究人員、專家和社區合作，推動技術創新，不斷改進模型性能。

模型地址：https://huggingface.co/stabilityai/sv4d

倫敦高院駁回Getty訴Stability AI案:AI模型訓練不構成版權侵權

英國高等法院駁回Getty Images對Stability AI的版權訴訟，成爲生成式AI領域重要判例。案件核心爭議在於使用受版權圖片訓練AI模型是否侵權。Getty指控對方未經授權抓取其數百萬照片訓練Stable Diffusion模型，稱此舉威脅創意產業生存。目前案件仍在推進中。

音頻創作迎來新突破！Stability AI 發佈 Stable Audio 3：長音頻秒級生成