在人工智能領域,OpenAI 於今日正式推出其最新的 GPT-4.1模型,隨之而來還有兩個小型版本:GPT-4.1mini 和 GPT-4.1nano。這一系列新模型的性能相較於前一代 GPT-4o 和 GPT-4o mini 有了顯著提升,尤其在編碼能力和指令跟蹤方面表現突出。此外,GPT-4.1還具備高達100萬個上下文 tokens 的支持能力,極大擴展了處理信息的範圍。

據測評,GPT-4.1在 SWE-bench Verified 的得分達54.6%,較 GPT-4o 提高了21.4%,在編碼模型中處於領先地位。其在指令遵循能力的評分也達到了38.3%,相較於前代提高了10.5%。此外,GPT-4.1在 Video-MME 多模態長上下文理解的測試中取得72.0% 的高分,相較於 GPT-4o 提高了6.7%。這樣的成績表明 GPT-4.1在處理複雜任務和理解長篇文本方面的優勢。

ChatGPT

圖源備註:圖片由AI生成

與此同時,智譜也推出了其新款32B/9B 系列 GLM 模型,直接與 GPT-4.1展開競爭。智譜的 Z.ai 平臺現已開放,讓用戶能夠免費體驗這些新模型的強大功能。兩者的發佈恰逢其時,展現了人工智能領域的激烈競爭。

在代碼生成方面,GPT-4.1在執行各種編碼任務時表現優異,其完成率從33.2% 提升至54.6%。此外,GPT-4.1在跨格式代碼差異分析上也顯著提高,爲 API 開發者節省了大量時間與成本。相比之下,智譜的 GLM-Z1-32B-0414在 IFEval 上的表現也不遜色,達到了84.5% 的高分。

對於長上下文理解,GPT-4.1可以處理高達100萬個 tokens,足以應對大型代碼庫和長篇文檔的需求。這種能力使其在法律、客戶支持等多領域的應用潛力巨大。

值得一提的是,GPT-4.1的使用成本比其前代降低了26%。相較之下,智譜的 Z.ai 在定價上也極具競爭力,爲用戶提供了更多選擇。