MiniMax於近日低調發布了首款視頻生成大模型,並同步推出由該模型生成的2分鐘視頻《魔法硬幣》。儘管公司尚未公開模型的具體參數和技術細節,但創始人閆俊傑在媒體羣訪中表示,其視頻生成效果優於Runway。

閆俊傑透露,當前發佈的僅是第一版模型,後續將在數據、算法和使用細節等方面持續迭代。除了現有的文生視頻功能,未來還將推出圖生視頻和文圖結合生成視頻的能力。對於商業化計劃,閆俊傑表示將在新版本達到滿意狀態後考慮。

相比快手可靈,MiniMax的視頻生成模型推出時間晚了一兩個月。閆俊傑解釋稱,這是因爲團隊一直在解決更具挑戰性的技術問題,特別是如何訓練算力較高的內容。他強調,MiniMax的核心研發思路是追求顯著的性能提升,而不僅僅是小幅度的改進。

機器人 人工智能  AI  (1)

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

閆俊傑認爲,開發視頻生成能力的核心動機是爲了提高用戶覆蓋度和使用度。他指出,人類日常消費的內容以圖文和視頻爲主,因此多模態內容生成是必然的發展方向。

然而,視頻生成大模型面臨着諸多挑戰。閆俊傑解釋,視頻生成的複雜度遠高於文本,包括處理長上下文、巨大的存儲需求以及基礎設施升級等問題。

MiniMax開放平臺負責人魏偉業指出,當前大模型面臨的主要挑戰包括不可避免的幻覺、高昂的使用成本以及多模態應用的開發。他認爲,隨着API成本的進一步降低,將會激發更多應用場景的出現。

面對行業內的諸多爭議,如toB還是toC、國內市場還是海外市場等問題,閆俊傑表示MiniMax對技術進步、用戶和產品迭代效率保持樂觀態度。