Lightricks 公司宣佈推出其最新的 AI 視頻生成模型 ——LTXV-13B。這款擁有130億參數的模型在生成高質量 AI 視頻方面速度提升了30倍,並且能夠在普通消費級硬件上運行,而無需昂貴的企業級 GPU。  

QQ_1746590080454.png

LTXV-13B 的核心技術是 “多尺度渲染”,這一創新方法顯著提高了視頻生成的效率。通過逐層生成視頻細節,創作者能夠在標準的桌面計算機和高端筆記本上製作專業品質的 AI 視頻。Lightricks 的聯合創始人兼首席執行官 Zeev Farbman 表示:“我們的用戶現在可以以更高的質量和一致性創作內容,並且能夠更好地控制整個過程。”  

AI 視頻生成面臨的一個主要挑戰是巨大的計算需求。許多公司如 Runway、Pika 和 Luma 等的模型通常需要在雲端運行,並依賴於配備80GB 以上顯存的多臺企業級 GPU,導致普通用戶很難在本地進行部署。Farbman 指出,LTXV-13B 能夠在消費級 GPU 上有效運行,使得高質量視頻生成不再是少數人的特權。  

多尺度渲染的創新使得 LTXV-13B 能夠逐步生成細節,首先在粗糙的網格上創建場景的粗略概覽,然後將場景分成多個小塊,並逐步填充更多細節。這種方法類似於藝術家從草圖到精細繪製的過程。此外,該模型採用了更壓縮的潛在空間,降低了內存需求,同時保持了視頻質量。  

與許多領先的 AI 模型不同,Lightricks 選擇將 LTXV-13B 完全開源,用戶可以在 Hugging Face 和 GitHub 上訪問。這一舉措旨在加速研究和改進,鼓勵學術界和開發者使用該模型。Farbman 表示,與 Getty Images 和 Shutterstock 的合作,Lightricks 可以合法獲取訓練所需的內容,降低版權風險,增強商業應用的合法性。  

QQ_1746590053161.png

爲了支持初創企業,Lightricks 還決定將 LTXV-13B 免費授權給年收入低於1000萬美元的公司。這一策略旨在建立一個開發者和公司社區,以展示該模型的價值。Farbman 表示,儘管 LTXV-13B 在技術上取得了顯著進步,AI 視頻生成仍然有侷限性,目前仍未能達到好萊塢電影的水平,但在動畫等領域有着廣泛的應用前景。  

LTXV-13B 現已作爲開源版本發佈,並將在 Lightricks 的創意應用中得到應用,包括其旗艦講故事平臺 LTX Studio。  

項目:https://huggingface.co/Lightricks/LTX-Video

劃重點:  

🎥 Lightricks 推出的 LTXV-13B 模型能在普通硬件上生成高質量視頻,速度提升30倍。  

🔍 新模型採用 “多尺度渲染” 技術,逐步生成視頻細節,提高效率。  

🤝 Lightricks 將 LTXV-13B 開源,並免費授權給年收入低於1000萬美元的初創企業。