4月15日,OpenAI 在其官方博客宣佈正式發佈 GPT-4.1系列模型,涵蓋 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。該系列在編程能力、指令理解及長文本處理等方面實現重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。其中,模型上下文窗口擴展至100萬 tokens,知識庫更新至2024年6月,爲複雜任務提供更強支持。
GPT-4.1系列目前僅面向開發者開放,通過 API 接口提供服務,普通用戶暫無法直接通過 ChatGPT 界面體驗。OpenAI 透露,GPT-4.1在編程場景中代碼生成速度較 GPT-4o 提升40%,同時用戶查詢成本降低80%,顯著優化開發效率與成本。


性能表現:多項基準測試刷新紀錄
- 編程能力:在 SWE-bench Verified 測試中,GPT-4.1得分達54.6%,較 GPT-4o 提升21.4個百分點;
- 指令遵循:MultiChallenge 測試中提升10.5個百分點;
- 多模態處理:Video-MME 測試創下72.0% 新高。
GPT-4.1mini 在多項測試中表現接近甚至超越 GPT-4o,延遲降低近50%,成本減少83%。而 GPT-4.1nano 作爲輕量化版本,以100萬 tokens 上下文窗口和80.1% 的 MMLU 得分,成爲分類與自動補全任務的性價比之選。通過推理棧優化與提示緩存技術,系列模型首次響應時間大幅縮短,爲開發者提供高效低成本的解決方案。
實際應用場景成效顯著
- 編程效率:Windsurf 測試顯示,GPT-4.1編程效率提升30%,無效編輯減少50%;
- 法律領域:Thomson Reuters 的法律 AI 助手 CoCounsel 接入 GPT-4.1後,多文檔審查準確率提升17%。
GPT-4.1輸入費用爲每100萬 tokens2美元(約合人民幣14.6元),輸出費用爲8美元(約合人民幣58.3元)。在中等查詢場景中,GPT-4.1較 GPT-4o 性能提升的同時,成本降低26%。其中,GPT-4.1nano 憑藉超低延遲與成本,成爲 OpenAI 當前最經濟的模型選擇。
