開源版“Veo 3”來了：LTX-2正式發佈，一次性生成20秒4K音畫同步AI視頻，本地顯卡輕鬆跑

AI視頻生成領域迎來里程碑式突破!Lightricks團隊正式開源LTX-2模型，這被譽爲首個真正完整的開源音視頻基礎模型，支持一次性生成最長20秒的4K高清視頻，並實現畫面、聲音、口型、環境音和音樂的完美同步。AIbase編輯團隊梳理最新網絡動態，爲您帶來全面解讀。

開源大禮包:權重+代碼全放出，社區狂歡開啓

LTX-2模型權重、完整訓練代碼、基準測試和工具包已全部開源，託管於GitHub和Hugging Face。開發者可自由檢查、微調和本地部署。該模型基於DiT混合架構，支持文本到視頻、圖像到視頻、多關鍵幀控制、3D相機邏輯和LoRA微調。最新動態顯示，ComfyUI已在發佈當日（Day0）原生支持LTX-2，提供現成工作流，極大降低上手門檻。NVIDIA RTX消費級顯卡優化後，生成效率大幅提升，普通用戶無需企業級硬件即可體驗專業級輸出。

核心亮點:音視頻合一，同步生成無須後處理

不同於傳統模型需單獨拼接音頻，LTX-2在單一流程中聯合生成視覺和聲音，確保動作、對白、環境音效與音樂自然對齊。支持原生4K分辨率、最高50fps幀率，最長20秒連續片段。實際測試顯示，口型同步和表情表現尤爲出色，人物對話場景高度逼真。同時，模型在複雜提示下保持較高一致性，皮膚質感和運動流暢度顯著優於多數開源競品。輸入模態靈活，可基於文字、圖片或草圖驅動生成，適用於短片、廣告和內容創作。

性能優化:速度更快、資源更省、本地運行友好

相比前代和部分競品，LTX-2計算成本降低最高50%，多GPU推理棧支持長序列擴展。量化版本進一步降低顯存需求，在RTX40系列及以上顯卡上流暢運行。社區反饋稱，10-20秒視頻生成僅需數分鐘，甚至實時預覽成爲可能。這標誌着高端AI視頻生成從雲端封閉走向本地開源民主化，極大降低創作者門檻。

應用潛力無限:從個人創作到專業製作

LTX-2已在內容創作、動畫、營銷和影視預演等領域展現強大潛力。支持Canny、Depth和Pose等視頻到視頻控制，結合關鍵幀驅動，可實現精確敘事和風格一致性。未來，隨着社區LoRA和插件擴展，該模型或將成爲開源AI視頻生態的核心引擎，推動從短視頻到長形式內容的創新。

AIbase觀點:LTX-2的開源不僅是技術飛躍，更是AI視頻民主化的關鍵一步。它填補了開源領域音視頻聯合生成的空白，或將加速本地AI工具的普及。AIbase將持續關注其社區發展和實際應用，敬請期待後續報道。

開源版“Veo 3”來了：LTX-2正式發佈，一次性生成20秒4K音畫同步AI視頻，本地顯卡輕鬆跑

相關推薦

火山引擎Seedance 2.0全面開放API服務

AI 交互新突破：Skywork AI 發佈 Matrix-Game 3.0，實現 720p 40 幀實時高清“世界生成”

火山引擎Seedance 2. 0 系列API正式上線，開放全球SOTA級視頻生成能力

谷歌推出 Veo 3.1 Lite 視頻模式：Ultra 訂閱用戶可免積分無限生成

阿里匿名模型 HappyHorse 橫掃全球榜單，視頻生成進入“高分時代”

開源版“Veo 3”來了：LTX-2正式發佈，一次性生成20秒4K音畫同步AI視頻，本地顯卡輕鬆跑

相關推薦

​火山引擎Seedance 2.0全面開放API服務

AI 交互新突破：Skywork AI 發佈 Matrix-Game 3.0，實現 720p 40 幀實時高清“世界生成”

火山引擎Seedance 2. 0 系列API正式上線，開放全球SOTA級視頻生成能力

谷歌推出 Veo 3.1 Lite 視頻模式：Ultra 訂閱用戶可免積分無限生成

阿里匿名模型 HappyHorse 橫掃全球榜單，視頻生成進入“高分時代”

火山引擎Seedance 2.0全面開放API服務