Midjourney 正式發佈其首個 AI 視頻生成模型 V1,標誌着這家以圖像生成聞名的公司邁向多媒體創作領域的全新里程碑。作爲全球領先的 AI 創意平臺,Midjourney 的此次發佈引發了數字藝術與視頻創作者的廣泛關注。本文由 AIbase 編輯部整理最新網絡信息,爲您詳細解讀 V1模型的核心亮點與未來潛力。

image.png

從靜態到動態:V1模型的核心功能

Midjourney V1視頻生成模型主打 圖像到視頻(Image-to-Video, I2V) 功能,用戶可通過其網頁界面上的“Animate”按鈕,將靜態圖像轉化爲動態視頻。默認生成時長爲5秒 的短視頻,每次生成提供 四段不同風格的視頻片段,用戶可選擇最符合需求的版本。此外,視頻時長支持以 每次4秒 的增量延長,最長可達20秒。

V1提供兩種運動模式:  

低動態模式:適合環境場景,相機保持相對穩定,主體以緩慢或刻意的方式移動,營造沉浸式氛圍。  

高動態模式:適用於節奏感更強的場景,帶來更具衝擊力的視覺效果。

用戶可選擇 自動動畫模式,由 AI 決定運動方式,或通過文本提示進行 手動定製,進一步調整視頻的創意方向。Midjourney 強調,V1繼承了其圖像模型 V6.1的高一致性,確保生成的視頻在細節與風格上保持卓越品質。

定價親民,面向廣泛創作者

Midjourney 以 低成本高可及性 爲目標,V1模型的定價策略延續了其一貫的親民風格。最低只需10美元/月 的 Basic 訂閱計劃即可體驗視頻生成功能,而 Pro 計劃(60美元/月) 和 Mega 計劃(120美元/月) 的用戶則可在“Relax”模式下享受 無限制視頻生成。不過,視頻生成任務的計算成本約爲圖像生成的8倍,用戶需合理規劃月度配額。

與此同時,Midjourney 暫未提供視頻的 超分辨率增強 或 音頻生成 功能,當前輸出分辨率爲480p,幀率爲24幀/秒。儘管在功能上與 Runway Gen-4、Luma Dream Machine 或 OpenAI 的 Sora 等競品相比略顯基礎,但其低門檻與高品質的視覺風格仍使其在市場中佔據獨特位置。

面向未來:Midjourney 的宏大願景

Midjourney 首席執行官 David Holz 在博客中表示,V1模型是公司邁向 實時開放世界模擬 目標的重要一步。相較於爲好萊塢或廣告行業生成簡單的 B-roll 素材,Midjourney 更專注於構建能夠生成 交互式3D 模擬 的 AI 模型。Holz 強調:“我們需要視覺(圖像模型),需要讓圖像動起來(視頻模型),這是通往未來世界的基石。”

V1的發佈不僅是技術突破,也爲 Midjourney 的生態系統注入了新活力。結合其最新發佈的 V7文本到圖像模型,用戶可從文本生成圖像,再無縫轉化爲視頻,形成完整的創意閉環。這種 端到端創作流程 爲獨立創作者、數字藝術家與中小企業提供了高效的工具。

挑戰與爭議:版權訴訟陰影

儘管 V1發佈引發熱議,Midjourney 卻面臨來自 迪士尼 和 環球影業 的版權侵權訴訟。兩家好萊塢巨頭指控 Midjourney 的 AI 模型在未經授權的情況下使用其知識產權(如《星球大戰》、《小黃人》等角色)進行訓練,並生成近乎複製的圖像與視頻。此訴訟可能對 Midjourney 的視頻服務擴展構成挑戰,也爲整個生成式 AI 行業的版權規範敲響警鐘。

用戶反饋與市場反響

根據網絡上的最新反饋,V1模型因其 操作簡便 和 視覺美感 受到創作者的廣泛好評。許多用戶表示,即使不輸入複雜提示,V1也能生成具有 真實感 和 細膩細節 的視頻,尤其在低動態場景中表現突出。然而,高動態場景可能出現輕微閃爍問題,顯示其技術仍有優化空間。

與此同時,V1的發佈在社交媒體上掀起熱潮。創作者們紛紛分享通過 V1生成的短視頻,展示了從夢幻風景到科幻場景的多樣化應用。Midjourney 的社區活躍度進一步提升,預計將吸引更多新用戶加入其平臺。

AIbase 編輯認爲 Midjourney V1的推出不僅是技術層面的突破,更是對 AI 創意工具民主化的又一次推動。其低成本與高品質的結合,使更多獨立創作者能夠以極低的門檻進入視頻創作領域。儘管當前功能較爲基礎,但 Midjourney 的清晰路線圖與宏大願景表明,V1只是其視頻生成旅程的起點。

未來,我們期待 Midjourney 在 分辨率提升、文本到視頻功能 以及 音頻整合 方面帶來更多創新。同時,版權爭議的解決也將是其能否持續領跑的關鍵。AIbase 將持續關注 Midjourney 的動態,爲您帶來第一手行業資訊。