OpenAI 正在推出新一代圖像生成模型 GPT Image1.5,以抗衡谷歌在人工智能領域的強勢崛起。據 AIbase 報道,這款新模型承諾帶來顯著的性能提升,包括更精確的指令遵循、更細緻的編輯控制以及高達四倍的圖像生成速度。
速度與精度升級:GPT Image1.5全面對抗谷歌
GPT Image1.5已於本週二面向所有 ChatGPT 用戶和 API 用戶開放。此次更新是在 OpenAI 首席執行官 Sam Altman 宣佈進入“紅色警戒”狀態後,爲重奪人工智能領導地位而採取的最新戰略舉措。
此前,谷歌發佈的旗艦模型 Gemini3 及其病毒式圖像生成器 Nano Banana Pro 表現強勁,在 LMArena 排行榜上名列前茅,並開始蠶食市場份額。儘管 OpenAI 上週推出了其聲稱“迄今爲止最先進”的模型 GPT-5.2,谷歌仍保持着領先地位。據報道,OpenAI 原計劃在1月初發布新的圖像生成器,但爲了應對競爭,此次發佈計劃被加速。

媲美后期製作:解決 GenAI 圖像一致性難題
GPT Image1.5是繼4月份發佈的 GPT Image1之後的又一迭代,它將圖像生成器從原型階段推向更具生產力的功能。新模型特別強調了後期製作功能,與 Nano Banana Pro 類似,它能提供更精細的編輯控制,從而在編輯過程中保持關鍵的視覺一致性(如面部相似度、光照、構圖和色調)。
這對 GenAI 圖像工具而言是一個重大進步。OpenAI 特別指出,大多數現有工具在迭代編輯方面表現不佳,例如當用戶要求“調整面部表情”或“使光線更冷”時,模型往往會重新解釋整張圖像,導致結果不一致。GPT Image1.5旨在解決這一指令跟隨難題。
整合“創意工作室”與視覺體驗優化
OpenAI 應用首席執行官 Fidji Simo 在一篇博客文章中透露,ChatGPT 現已通過側邊欄提供 “更像是一個創意工作室”的專用入口來訪問圖片功能。新的圖像查看和編輯界面旨在讓用戶更容易創作出符合其想法的圖像,或從熱門提示和預設濾鏡中獲得靈感。
除了新的圖像生成器,OpenAI 還計劃通過引入更多視覺元素來改進 ChatGPT 的整體使用體驗。Simo 表示,未來的搜索查詢將顯示更多帶有清晰來源的視覺元素,這對於單位換算或查看體育比分等任務將非常有用。
Simo 總結道:“當你腦海中的想法與你將其變爲現實的能力之間的差距不斷縮小,我們才能更好地爲你服務。”
