在今日凌晨的直播活動中,OpenAI正式推出了備受矚目的GPT-5模型,宣稱其爲自家迄今爲止最出色的模型,在編程、數學、寫作、健康、視覺感知等多個領域均展現出頂尖實力。

OpenAI正式發佈GPT- 5 模型:面向所有用戶開放 更像人類專家

OpenAI首席執行官薩姆·奧爾特曼(Sam Altman)在發佈會上表示,GPT-5是公司此前人工智能模型的重大升級,與它交流如同與各領域專家對話。

據悉,GPT-5將於本週四起逐步向免費用戶和付費用戶開放。付費用戶將享有更高的使用限額,而Pro訂閱者更可無限訪問GPT-5,並體驗GPT-5Pro的強大功能。Plus用戶則能將其設爲日常問題的默認模型,使用量遠超免費用戶。

OpenAI正式發佈GPT- 5 模型:面向所有用戶開放 更像人類專家

OpenAI正式發佈GPT- 5 模型:面向所有用戶開放 更像人類專家

GPT-5是一個高度統一的系統,由智能高效模型、深度推理模型(GPT-5thinking)和實時路由器三大部分組成。智能高效模型負責回答大多數問題,深度推理模型則專攻複雜難題。實時路由器則根據對話類型、複雜性等因素,智能選擇最合適的模型進行處理,並持續基於真實信號進行訓練改進。一旦達到使用限制,各模型的精簡版將接手處理剩餘查詢,未來OpenAI計劃將這些功能整合至單一模型中。

在基準測試中,GPT-5的表現超越了以往所有模型,不僅回答問題速度更快,而且解答更具實用性,有效減少了幻覺現象,改進了指令遵循能力,並最大程度減少了諂媚性回答。特別是在寫作、編程和健康諮詢等ChatGPT常見應用場景中,GPT-5的表現提升尤爲顯著。

OpenAI正式發佈GPT- 5 模型:面向所有用戶開放 更像人類專家

OpenAI正式發佈GPT- 5 模型:面向所有用戶開放 更像人類專家

在編程領域,GPT-5被譽爲迄今爲止最強的編程模型,在複雜前端生成和大型代碼庫調試方面取得了顯著進步,能夠根據單個提示創建美觀且響應迅速的網站、應用程序和遊戲等。在創意表達與寫作方面,GPT-5能將粗略想法轉化爲富有文學深度和節奏感的作品,更好地處理結構模糊的寫作任務,並在日常寫作中提供更多幫助。在健康領域,GPT-5在與健康相關的問題上表現最佳,HealthBench得分顯著高於以往模型,能更主動地標記潛在問題並提問,以提供更有幫助的答案,還能根據用戶背景、知識水平和地理位置提供更精確可靠的響應,但OpenAI明確強調,該模型不能替代醫療專業人員。

此外,GPT-5在數學(AIME2025無工具時得分94.6%)、真實世界編程(SWE-bench Verified得分74.9%、Aider Polyglot得分88%)、多模態理解(MMMU得分84.2%)和健康(HealthBench Hard得分46.2%)等方面也創造了新的最先進水平。

值得一提的是,GPT-5Pro憑藉其擴展推理能力,在GPQA測試中也創造了新的最先進水平,無工具時得分高達88.4%。作爲OpenAI推出的用於最具挑戰性、最複雜任務的模型,GPT-5Pro替代了之前的OpenAI o3-Pro,其思考時間更長,使用規模化但高效的並行測試時計算,能夠提供最高質量和最全面的答案。

在多個具有挑戰性的智力基準測試中,GPT-5Pro均表現出色,在超過1000個有經濟價值的真實世界推理提示評估中,外部專家在67.8%的情況下更青睞GPT-5Pro,其主要錯誤減少了22%,在健康、科學、數學和編程方面均展現出卓越實力。