近日,以色列科技公司Lightricks發佈了其開源AI視頻生成模型的最新版本——LTX-Video-13B精煉模型(LTXV-13B v0.9.7-distilled)。這款模型以130億參數爲基礎,通過多尺度渲染技術和高效量化優化,將視頻生成速度提升至驚人的10秒以內,標誌着AI視頻生成技術的新里程碑。AIbase深入解析這一突破性進展,帶您瞭解其技術亮點與行業影響。
項目地址:https://github.com/Lightricks/LTX-Video
模型地址:https://huggingface.co/spaces/Lightricks/ltx-video-distilled
技術突破:10秒生成高清視頻
LTX-Video-13B精煉模型採用先進的多尺度渲染技術,通過從低分辨率草圖逐步精煉至高清畫質,顯著縮短了視頻生成時間。據AIbase瞭解,該模型能夠在NVIDIA RTX4090等消費級GPU上實現10秒內生成1216×704分辨率視頻,相較上一代模型提速近5倍,低分辨率預覽甚至僅需3秒。這種速度突破使得實時視頻生成成爲可能,爲創作者提供了前所未有的效率體驗。
此外,該模型支持關鍵幀編輯、相機運動控制和多鏡頭序列,賦予用戶更高的創作自由度。無論是生成動態場景還是複雜的人物動作,LTXV-13B都能呈現更流暢的運動軌跡和更清晰的細節,視頻質量媲美專業影視作品。
開源賦能:低顯存設備也能玩轉AI視頻
作爲一款完全開源的模型,LTX-Video-13B精煉模型延續了Lightricks對技術普惠的承諾。AIbase注意到,該模型特別推出了量化版本(fp8)和LoRA適配版本,大幅降低了硬件門檻。即使在低顯存設備上,用戶也能運行該模型,生成高質量視頻。這一特性尤其適合獨立創作者和中小企業,極大地降低了AI視頻製作的成本。
模型已在Hugging Face和GitHub上開放下載,並通過ComfyUI提供兼容支持,開發者可以輕鬆集成到現有工作流中。Lightricks還爲年收入低於1000萬美元的企業提供免費許可,進一步推動了AI視頻技術的普及。
效率與質量兼得:30倍速度提升的祕密
LTX-Video-13B精煉模型不僅速度驚人,還在視頻質量上實現了顯著提升。得益於與Shutterstock和Getty Images的合作,該模型在高質量視頻數據集上進行了訓練,生成的視頻畫面更具電影感,場景連貫性更強。AIbase獲悉,其核心技術UEfficient Q8內核優化了模型在消費級硬件上的性能,確保即便在普通筆記本電腦上也能實現高效運行。
相比同類模型,LTXV-13B的生成速度提高了30倍,生成一個視頻的平均時間僅爲37.59秒,而競爭對手在同等硬件上可能需要近25分鐘。這種效率的飛躍,使其在實時生成、虛擬主播(VTubing)等場景中展現出巨大潛力。
行業影響:挑戰OpenAI與Google的國產力量
Lightricks此次發佈被業內視爲對OpenAI Sora、Google Veo等巨頭模型的強有力挑戰。AIbase分析認爲,LTX-Video-13B精煉模型以更低的訓練成本(僅數千萬美元)實現了媲美頂級模型的性能,展現了開源社區和中小型科技公司在AI領域的創新能力。其多尺度渲染和VACE模型推理等開源貢獻,也爲全球AI視頻生成技術的發展注入了新活力。
對於創作者而言,LTXV-13B的出現意味着無需昂貴的專業設備,就能製作出高質量的動畫、短片或營銷視頻。AIbase預測,該模型將加速AI視頻工具在影視、廣告和社交媒體領域的普及,重塑內容創作生態。
AI視頻生成的“Deepseek時刻”
作爲AI領域的專業媒體,AIbase認爲,LTX-Video-13B精煉模型的發佈不僅是Lightricks的技術巔峯之作,更是開源AI社區的一次集體勝利。其超高速生成能力和低硬件門檻,打破了AI視頻生成的技術壁壘,讓更多人能夠參與到智能化創作中。