OpenAI 正式發佈全新視頻生成模型 Sora2,並同步推出 iOS 社交應用 Sora,以 AI 驅動的短視頻社區重新定義內容創作。Sora2在視頻真實性、音頻生成和可控性上實現突破,而 Sora App 則通過創新功能如“Cameo”將 AI 創作與社交互動無縫結合。目前 App 採用邀請制,優先向美國和加拿大用戶開放,未來將擴展至全球。

image.png

Sora2:視頻生成技術的革命性飛躍

Sora2被 OpenAI 譽爲“視頻領域的 GPT-3.5”,相較於2024年首發的 Sora,其性能大幅提升:

  • 真實物理模擬:Sora2能精確模擬複雜運動,如籃球反彈、滑板特技或跳水動作,視頻畫面接近現實世界。
  • 同步音頻生成:首次集成對話、音效和背景音樂,生成沉浸式多媒體內容,告別無聲視頻時代。
  • 長序列與精細控制:支持最長10秒的視頻生成,用戶可通過文本或圖像提示精確調整細節,滿足專業與日常創作需求。

演示視頻中,從沙灘排球到武術表演,Sora2的流暢度和真實感令人歎爲觀止,標誌着 AI 視頻生成進入成熟階段。

Sora App:AI 驅動的社交新體驗

同名社交應用 Sora 定位爲 AI 短視頻社區,類似 TikTok 的垂直滾動界面,融合個性化算法和創新功能:

image.png

  • Cameo 功能:用戶通過一次性視頻驗證身份,即可將自己或朋友的肖像“插入”任何 Sora 生成的場景,輕鬆實現虛擬 cameo 表演。例如,用戶可生成自己在奇幻世界冒險的視頻。
  • 個性化推薦:基於用戶互動、位置和 ChatGPT 歷史,算法精準推薦內容,同時支持 remix 和私信分享,激發“粉絲式創作”。
  • 跨平臺潛力:目前僅限 iOS(Android 版即將推出),ChatGPT Pro 訂閱者可優先解鎖“Sora2Pro”模式,享受更高品質生成,免費用戶則有基礎限額。

安全與責任:嚴守道德底線

OpenAI 強調負責任的 AI 使用,Sora2和 App 內置多重安全機制:

  • 內容溯源:所有生成視頻嵌入 C2PA 元數據水印,支持反向圖像/音頻搜索,確保來源可追蹤。
  • 青少年保護:加強內容過濾、家長控制,成人無法主動私信未成年人,並提供非個性化 feed 選項。
  • 防濫用措施:Cameo 功能需嚴格身份驗證和授權,用戶可隨時撤銷權限,降低 deepfake 風險。

生態擴展與行業影響

Sora2API 即將上線,開發者可將其集成至第三方應用,拓展商業場景。OpenAI 還計劃未來迭代“機器人代理”和“世界模擬器”,進一步推動 AI 技術邊界。

在競爭激烈的 AI 視頻領域,Sora2的真實性與 App 的社交創新使其脫穎而出,挑戰谷歌 Veo3和 Meta Vibes feed。然而,知識產權爭議浮出水面:OpenAI 允許使用版權素材生成內容(除非 opt-out),可能引發法律討論。

展望:重塑內容創作未來

Sora2和 Sora App 的發佈,不僅降低了 AI 視頻創作門檻,還通過社交平臺將技術普及至大衆。從專業創作者到普通用戶,每個人都能借助 AI 釋放想象力。OpenAI CEO Sam Altman 表示:“Sora2是通向通用世界模擬器的關鍵一步,將重塑娛樂與創作方式。” 

https://openai.com/index/sora-2/