在 AI 技術迅猛發展的背景下,Lightricks 公司近日發佈了其最新研發的 AI 視頻生成模型 ——LTX-2。這一模型能夠一次性生成長達20秒的完整4K 敘事高清視頻,配有聲音和口型同步,爲視頻創作帶來了革命性的進展。

LTX-2的核心技術在於其音畫同步生成能力,傳統的 AI 視頻生成工具往往只能生成無聲視頻,隨後需要人工添加配音。而 LTX-2則在同一個擴散過程中同時生成畫面與聲音,確保角色的嘴型與語音、爆炸的音效與光線、走路的節奏與腳步聲完全同步。這一創新使得生成的視頻更具真實性和連貫性。

此外,LTX-2支持最高4K 分辨率和50幀每秒的輸出,畫面質量堪比電影級別。其連貫性和穩定性在視頻生成領域中也達到了新的高度,成爲首個能夠穩定生成原生4K 視頻的開源 AI 模型。這意味着,創作者們可以直接將生成的視頻用於電影、廣告或宣傳片,而不再是簡單的 AI 動畫草圖。

該模型還支持多種輸入方式,包括文字、圖片和草圖,允許創作者對視頻的鏡頭角度、物體動作、時間節奏等進行精細控制。這種創作自由度的提高使得內容創作者可以更好地表達自己的創意。此外,內置的 LoRA(Low-Rank Adaptation)微調機制讓用戶能夠以少量素材訓練出專屬風格模型,確保視頻在不同場景中的一致性。

LTX-2的另一個顯著優勢是其本地運行能力,用戶無需連接雲端,也不被鎖定在收費平臺上。該模型可在消費級 GPU 上運行,預計將在2025年秋季開放源代碼、模型權重及訓練流程,爲創作者、開發者和研究者提供更多的控制權和隱私保障。

Lightricks 公司計劃於今年晚些時候將 LTX-2的代碼和性能基準開源,進一步推動 AI 視頻生成技術的發展。用戶可以通過官方平臺體驗這一新模型,期待在未來的 AI 創作領域,LTX-2能夠成爲視頻製作的 “遊戲規則改變者”。

隨着 LTX-2的發佈,視頻創作的門檻將進一步降低,更多的創作者有機會藉助這一先進技術實現自己的創意與夢想。