OpenAI在經過12天的技術分享直播活動後,於最後一天發佈了其下一代推理模型o3,這是繼早前發佈的o1推理模型之後的升級版本。o3模型系列包括o3和o3-mini兩個版本,其中o3-mini是針對特定任務進行微調的更小的精簡版模型。OpenAI表示,o3模型在某些條件下可以接近實現通用人工智能(AGI),即能完成人類所能完成的任何任務的人工智能。
在ARC-AGI圖形邏輯推理基準測試中,o3模型取得了破紀錄的分數,低計算場景下得分爲75.7%,而在高計算測試中,它達到了87.5%,超過了標誌着達到人類水平的門檻85%。相比之下,o1模型的得分僅在25%到32%之間,o3的表現幾乎是o1的三倍。在全球著名的編碼競賽平臺Codeforces上,o3取得了2727的評分,而o1評分僅爲1891。
獵豹移動獵戶星空董事長傅盛表示,OpenAI o3的發佈預示着人人都是程序員的時代即將到來,用戶無需精通Python或C語言也能編寫程序,只需提出需求,大預言模型即可幫助完成編程工作。傅盛認爲,o3的發佈標誌着大語言模型的編程能力超越了99.9%的程序員,在Codeforces世界級編程比賽中,o3取得了175名的頂尖成績,而o1大概只戰勝了90%多的程序員,之前GPT-4o只戰勝了11%的程序員。
OpenAI計劃在明年1月底正式發佈o3模型。傅盛指出,雖然程序員不會完全消失,但他們的工作將更多地轉向理解用戶需求和構建大邏輯,而將需求轉化爲代碼的工作將大幅度地由AI完成。這一發布預示着AI在編程領域的應用將更加廣泛,同時也可能改變程序員的工作方式。