AIBase消息, 2025 年 8 月 8 日,OpenAI正式發佈了其備受矚目的新一代人工智能模型GPT-5。這是自GPT- 4 發佈以來最重要的模型升級,標誌着AI技術發展的又一重要里程碑。

技術突破:統一模型架構的全面升級

GPT- 5 將OpenAI此前的多項技術突破整合到一個統一系統中,包括GPT-4o的多模態能力、o系列的推理功能、以及高級數學處理能力。與以往需要切換不同模型完成不同任務的方式不同,GPT- 5 採用了智能路由系統,能夠根據對話類型、複雜度和工具需求自動選擇最適合的處理方式。

在覈心性能指標上,GPT- 5 表現出顯著提升:數學能力達到94.6%(AIME2025 基準測試),編程能力在實際代碼庫測試中達到74.9%(SWE-bench Verified),多模態理解能力爲84.2%(MMMU基準測試)。

image.png

用戶體驗:全面開放,分層服務

OpenAI採用了前所未有的開放策略,GPT- 5 對所有ChatGPT用戶開放,包括免費用戶、Plus、Pro和Team用戶,這是免費用戶首次獲得推理模型的使用權限。

具體的用戶權限分配如下:

免費用戶:可直接使用GPT- 5 基礎版本,首次體驗到具備"思考"能力的推理模型

Plus用戶:除基礎版本外,還可使用"GPT-5 Thinking"版本,享受更強的推理能力

Pro用戶:享有GPT- 5 和GPT-5 Pro的無限制訪問權限,並可根據需要切換到舊版本模型

企業和教育用戶:將在下週獲得訪問權限,同時還將獲得GPT-5 Pro版本,提供更可靠和詳細的擴展推理功能

技術創新:大幅降低"幻覺"問題

在降低AI"幻覺"(虛假信息生成)方面,GPT- 5 取得了重大突破。在匿名化的ChatGPT生產環境測試中,GPT- 5 的回答包含事實錯誤的概率比GPT-4o降低約45%,而在使用推理功能時,錯誤率比o3 模型降低約80%。

此外,GPT- 5 在效率方面也有顯著提升,在視覺推理、代碼編寫和研究生水平科學問題解決等任務中,其表現優於o3 模型,但輸出token數量減少50-80%。

實際應用:重新定義人機交互

在發佈會演示中,OpenAI展示了GPT- 5 的"氛圍編程"(vibe coding)能力,用戶只需提供簡單的文字描述,就能快速生成完整的Web應用程序。例如,當要求創建幫助英語使用者學習法語的應用時,GPT- 5 在幾秒鐘內就生成了包含閃卡、測驗和進度跟蹤功能的完整應用。

在用戶體驗設計上,GPT- 5 也有明顯改進。相比GPT-4o,新模型減少了過度討好的表達方式,使用更少的不必要表情符號,在後續對話中更加微妙和體貼,讓用戶感覺"不像是在與AI對話,而更像是在與一個擁有博士級智能的朋友聊天"。

商業影響:推動企業AI應用新浪潮

截至目前,已有 500 萬付費用戶在使用ChatGPT的商業產品,包括BNY Mellon、加州州立大學、Figma、Intercom、Lowe's、摩根士丹利、軟銀、T-Mobile等組織已經將AI工具整合到員工工作流程中。

GPT- 5 的發佈預計將進一步加速企業對AI技術的採用,特別是在決策制定、協作改進和高風險工作的快速執行方面。

發佈背景:行業競爭加劇

在當前AI競爭加劇的背景下,特別是美國政府表示要"不惜一切代價"在AI領域擊敗中國的情況下,GPT- 5 的發佈顯得格外重要。這一發布也實現了OpenAI CEO Sam Altman此前在 2025 年 2 月提到的"幾個月內"發佈GPT- 5 的承諾。

據悉,GPT- 5 在微軟Azure AI超級計算機上完成訓練,代表了目前AI基礎設施的最高水平。

行業展望

GPT- 5 現已成爲ChatGPT的新默認模型,取代了此前的GPT-4o、o3、o4-mini、GPT-4. 1 和GPT-4.5。用戶只需打開ChatGPT並輸入問題,GPT- 5 會自動處理其餘工作,並在需要時自動應用推理功能。

隨着GPT- 5 的全面部署,AI技術在日常工作和生活中的應用預計將迎來新的發展階段。這不僅僅是一次技術升級,更可能重新定義人與AI交互的方式,爲各行各業帶來新的可能性。

相關鏈接