近日,OpenAI 發佈了一則引人注目的消息:在其內部測試的項目 Sora 中,除了已經推出的視頻生成功能外,圖像生成功能也在緊鑼密鼓地研發中。這個新功能讓用戶能夠在視頻和圖像生成之間快速切換,提升創作的靈活性。
根據內部消息,Sora 將會增加一個隱藏的切換按鈕,用戶只需在提示欄中選擇即可在兩種模式之間切換。當選擇圖像生成時,系統會自動提示用戶描述一幅圖像。這一設計旨在簡化用戶操作,提高生成內容的相關性和質量。
除了圖像生成功能的改進,Sora 還對其視頻推送進行了重新分類。新推出的 “Best” 和 “Top” 類別將幫助用戶更好地篩選和查找內容。“Best” 類別與目前的特色頻道類似,而 “Top” 類別則可能根據用戶點贊數或時間段對視頻進行排名。這一分類的變化讓人們對 Sora 的內容推薦機制充滿期待。
對於 DALL-E3的用戶來說,這一消息無疑讓人興奮,因爲 DALL-E3自發布以來已經顯得有些過時,特別是在與 Midjourney 等競爭對手相比時。儘管目前 Sora 的圖像生成功能尚未正式推出,但左側導航欄中的 “Images Internal” 類別已經引發了用戶的好奇心。雖然目前這個類別主要用於視頻推送,但未來也可能會提供圖片生成的相關內容。
有人猜測,這次的圖像生成模型或許會被稱爲 DALL-E4,然而 OpenAI 尚未對此進行確認。業內專家推測,Sora 中的圖像生成器可能不會直接使用 DALL-E4,而是會依賴於現有的 “sora-turbo” 模型。此外,業內人士也指出,ChatGPT 尚未推出基於 GPT-4o 的多模態圖像生成功能,因此此次 Sora 項目的推出將是一個值得關注的新進展。
值得注意的是,Sora 中的文本到圖像生成器的代號被稱爲 “papaya”,讓人對這個項目充滿好奇與期待。在 DALL-E3發佈一年半之後,下一代模型究竟會帶來怎樣的創新,令人不禁想要一探究竟。