最近,AI 視頻公司 Genmo 宣佈推出 Mochi1,這是一個全新的開源視頻生成模型,用戶可以通過文本提示生成高質量的視頻。Mochi1的表現被認爲與當前市場上領先的閉源競爭對手如 Runway、Luma AI 的 Dream Machine、快手的 可靈、Minimax 的 Hailuo 等等相媲美,甚至更優。

image.png


該模型在 Apache2.0許可證下開放,用戶無需支付費用就能享受到尖端的視頻生成技術,而其他競爭產品的收費標準則從有限的免費計劃到每月高達94.99美元不等。

用戶可以在 Hugging Face 上免費下載 Mochi1的模型權重和代碼,不過,想要在個人設備上運行這個模型,至少需要四塊 Nvidia H100GPU。爲了讓用戶體驗 Mochi1的功能,Genmo 還提供了一個在線的試玩平臺,讓大家可以親自嘗試這項新技術。

Mochi1生成的視頻效果案例:

根據 Genmo 的說法,Mochi1擅長遵循詳細的用戶說明,允許對生成視頻中的字符、設置和操作進行精確控制。Genmo 已經聲稱,在內部測試中,Mochi1在快速粘附和運動質量方面擊敗了大多數其他視頻 AI 模型,包括專有的競爭對手 Runway 和 Luna。

image.png

image.png

Mochi1在視頻生成領域取得了顯著的進展,包括高保真運動表現和精準的提示遵循能力。Genmo 的 CEO Paras Jain 表示,他們的目標是縮小開放源代碼和閉源視頻生成模型之間的差距。他強調,視頻是最重要的交流形式,因此他們希望將這項技術推廣給更多的人。

與此同時,Genmo 還宣佈完成了2840萬美元的 A 輪融資,投資者包括 NEA 和多家風險投資公司。Jain 指出,視頻生成不僅僅是娛樂或內容創作,還是未來機器人和自主系統的重要工具。

Mochi1的架構基於 Genmo 獨創的非對稱擴散變換器(AsymmDiT),這是迄今爲止發佈的最大開源視頻生成模型,參數高達100億。這個模型專注於視覺推理,使其在處理視頻數據方面更具優勢。

Mochi1生成的視頻效果案例:

儘管 Mochi1已經展現出強大的功能,但目前仍有一些侷限性,比如目前支持的分辨率爲480p,且在複雜運動場景中可能會出現輕微的視覺失真。Genmo 計劃在年內推出支持720p 分辨率的 Mochi1HD 版本,以提升用戶體驗。

試玩入口:https://www.genmo.ai/play

模型下載:https://huggingface.co/genmo/mochi-1-preview

劃重點:

🌟 Mochi1是 Genmo 推出的開源視頻生成模型,用戶可免費使用,性能媲美多款閉源產品。

💰 Genmo 完成了2840萬美元的 A 輪融資,旨在推動 AI 視頻技術的民主化。

🎥 未來將推出 Mochi1HD 版本,解決當前480p 分辨率和複雜運動場景中的一些侷限。