近日,OpenAI 正式向開發者推出其最新的編程模型 ——GPT-5.1-Codex-Max。這一新模型不僅在性能上有了顯著提升,而且在價格上卻與其前身 GPT-5保持一致,成爲開發者們熱議的焦點。
GPT-5.1-Codex-Max 的主要亮點在於其 “代理式” 編碼能力和超長時間運行的特性。通過名爲 “壓縮(compaction)” 的技術,該模型可以在超過一百萬個 tokens 的上下文中持續工作,這使得它在執行復雜任務時表現得更加穩定。根據內部測試,GPT-5.1-Codex-Max 能夠連續運行超過24小時,堪稱編程領域的一大進步。
在多項權威的基準測試中,GPT-5.1-Codex-Max 的表現尤爲突出。例如,在 SWE-Bench Verified、SWE-Lancer IC SWE 和 TerminalBench2.0等測試中,該模型的得分分別達到了77.9%、79.9% 和58.1%,相較於常規版 GPT-5.1-Codex 有了明顯的提升。這些測試結果顯示,GPT-5.1-Codex-Max 在處理複雜的、多步驟的開發任務時具有更大的優勢。
在商用方面,OpenAI 以與 GPT-5相同的價格將 GPT-5.1-Codex-Max 接入 API,輸入端的費用爲每百萬 tokens1.25美元,輸出端爲每百萬 tokens10美元。此舉無疑是 OpenAI 向開發者市場的進一步拓展,尤其是針對那些使用 Windows 作爲主要開發平臺的程序員。與以往的 Codex 系列偏向 Unix 環境優化不同,這一新模型在訓練階段特別針對 Windows 環境進行了適配。
目前,GPT-5.1-Codex-Max 已經迅速進入多款熱門開發工具的生態系統,包括 Cursor、GitHub Copilot 和 Linear 等編程助手產品。在 GitHub Copilot 中,該模型將向 Pro、Pro+、Business 和 Enterprise 訂閱用戶開放,爲程序員提供更爲高效的編碼體驗。
不過,OpenAI 此次推出新模型的舉動也被解讀爲對競爭對手 Anthropic 的有力反擊。後者近年來專注於企業級編碼模型,已取得顯著成就。因此,GPT-5.1-Codex-Max 的推出,標誌着 OpenAI 在開發者市場的又一重要佈局,雙方在高端開發工具領域的競爭也將愈演愈烈。
