OpenAI 近日在視頻 AI 領域再次引發轟動,他們正在對今年2月發佈的 Sora 進行重大升級。根據《信息日報》的報道,這次升級的核心目標是顯著提升 Sora 的性能,使其能夠更快速地生成更長、更高質量的視頻內容。

回顧 Sora 初版的表現,確實存在不少亟待解決的問題。最初版本生成一段視頻需要耗時超過10分鐘,這樣的效率顯然無法滿足實際應用需求。更嚴重的是,許多電影製作者對 Sora 的輸出質量頗有微詞。

製片人 Patrick Cederberg 的經歷就是一個典型案例:爲了獲得一個可用的視頻,他不得不生成上百個片段。Sora 在保持風格、物體和角色一致性方面的表現欠佳,物理錯誤頻出,這些問題嚴重影響了其實用性。

元宇宙 科幻 賽博朋克 大模型 (2)繪畫

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

然而,這些挑戰在視頻 AI 領域並非罕見。新版 Sora 的開發正是針對這些問題展開的。爲了全面提升系統性能,OpenAI 正在收集數百萬小時的高分辨率視頻作爲訓練素材,涵蓋多種風格和主題,旨在減少模型的偏差,提高輸出質量。

值得注意的是,自 Sora 發佈以來,視頻 AI 市場的競爭態勢日益激烈。中國市場相繼推出了 可靈、Vidu、即夢 AI 和 MiniMax 四個新系統。與此同時,Runway ML 也不甘落後,推出了兩個新的 AI 模型,並剛剛宣佈與 Lionsgate 達成合作。這種競爭態勢無疑將推動整個行業的快速發展。

儘管 OpenAI 在今年9月初向 CNBC 表示,Sora 仍處於研究階段,需要與政策制定者進行深入討論,但公司 CTO Mira Murati 在3月中旬卻表現出十足的信心。她明確表示,Sora 必將在今年內正式發佈。不過,Murati 也坦言,目前的系統運行成本過高,被形容爲 "奢侈品中的奢侈品",因此降低生成成本也是 OpenAI 的一個重要任務。

Sora 的這次升級無疑是一次充滿挑戰和機遇的旅程。它不僅要解決技術層面的問題,還需要在效率、成本和質量之間尋找平衡。如果 OpenAI 能夠成功克服這些障礙,Sora 很可能會成爲視頻製作行業的一個重要變革力量。

隨着 AI 技術在視頻領域的不斷深入,我們可以預見,未來的視頻創作將變得更加高效和多樣化。這不僅會爲專業製作者提供新的工具,也可能爲普通用戶開啓視頻創作的新天地。儘管目前 Sora 還面臨着諸多挑戰,但它的發展方向無疑代表了視頻 AI 的未來趨勢。