2025年3月9日,美國加利福尼亞州——開源模型正讓文生視頻技術變得越來越有趣。AI 開發者 Ostris(@ostrisai)近日在 X 平臺上分享了他使用自家照片訓練的 Wan2.1LoRA 模型成果,僅憑約20張照片和一塊家用 RTX4090顯卡,便實現了令人驚歎的視頻生成效果。這一成果不僅展示了開源技術的潛力,也引發了 X 社區對視頻 LoRA 訓練工具的熱烈討論。
Ostris 的驚豔實驗
Ostris 在3月7日的 X 帖子中首次展示了 Wan2.114B LoRA 的訓練成果。他寫道:“Wan2.114B LoRA 訓練在24GB 上成功運行!在4090上以480p 分辨率平均每步1.7秒。”他還分享了一段初步視頻,證明了這一模型在家用硬件上的可行性。隨後在3月9日,他進一步發佈了一段“低成本概念驗證短音樂視頻”,搭配自己創作的歌詞和 @SunoMusic 生成的音樂,視頻中的數字人形象正是基於他自己的照片訓練而成。
Ostris 表示,他僅使用了約20張個人照片,通過其開發的視頻 LoRA 訓練工具完成了這一過程。他在帖子中感嘆:“沒想到效果這麼好!我玩得很開心。”這一實驗不僅驗證了 Wan2.1LoRA 的強大性能,也展示了普通用戶利用開源工具實現高質量文生視頻的可能性。
訓練工具開源共享Ostris 開發的視頻 LoRA 訓練工具成爲此次發佈的一大亮點。用戶 @sundyme 在3月9日發帖稱:“視頻 LoRA 訓練來了,讓你成爲 AI 視頻的主角!”並分享了 Ostris 的工具鏈接。這一工具支持 Wan2.1模型,允許用戶通過少量照片訓練個性化視頻模型,顯著降低了技術門檻。
X 用戶對這一工具表現出濃厚興趣。@sundyme 表示:“由 @ostrisai開發的 LoRA 訓練工具,支持 Wan2.1,效果驚豔。”社區反饋顯示,該工具在 RTX4090等消費級顯卡上的高效運行,讓更多創作者能夠在家嘗試 AI 視頻生成。
社區反響與技術意義
X 上的反響顯示,Ostris 的成果激起了廣泛熱情。一名用戶評論:“用20張照片就能訓練出這麼逼真的數字人,太不可思議了!”另一位用戶則稱讚開源模型的潛力:“文生視頻越來越有趣了,開源讓普通人也能玩轉 AI。”
業內人士認爲,Ostris 的實驗凸顯了開源模型在視頻生成領域的突破。Wan2.1LoRA 結合少樣本訓練技術,不僅降低了硬件需求,還提升了個性化創作的可及性。與傳統需要龐大數據集和高性能服務器的模型相比,這一方法爲獨立開發者和小型團隊開闢了新路徑。
項目地址:https://github.com/ostris/ai-toolkit