4月10日,智譜正式發佈並開源了新一代旗艦模型 GLM-5.1。這款模型最顯著的突破在於其長程任務(Long-Horizon Task)處理能力,成爲了全球首個能實現“8小時連續工作”的開源模型。

image.png

核心突破:從“一問一答”到“自主辦公”

智譜團隊指出,大模型的下一階段標準不再是簡單的榜單分數,而是“能獨立工作多久”:

  • 8小時級續航: GLM-5.1能夠在一次任務中獨立、持續工作超過8小時。期間它可以自主規劃、執行、定位瓶頸並自我進化,最終交付工程級成果。

  • 代碼能力登頂: 在衡量專業軟件開發的 SWE-bench Pro 基準測試中,GLM-5.1實現了國產模型對海外頂尖模型Opus4.6首次超越。

  • 實測性能驚人: 在針對海量數據檢索系統的編程測試中,GLM-5.1經過6000多次操作優化,最終運行速度達到了此前最好成績的6倍。

image.png

行業風向:告別“價格戰”,轉向“性能溢價”

隨着性能的跨越式提升,智譜的定價策略也發生了重大轉向:

  • 價格追平海外: 平臺數據顯示,GLM-5.1再次提價10%。在編碼場景下的定價已首次追平海外頭部廠商Anthropic

  • 迴歸商業價值: 智譜 CEO 張鵬表示,長期低價競爭不利於行業,調價是爲了將 AI 價值拉回正常區間。目前智譜已實現全球範圍內的價值變現,API 業務 ARR(年度經常性收入)同比提升達60倍。

市場趨勢:底層算力與模型集體步入“漲價潮”

2026年開年以來,國內 AI 行業正經歷從“低價換量”到“價值定價”的集體轉型:

  • 騰訊雲: 宣佈 AI 算力及容器服務等產品統一上調5%。

  • 阿里雲: AI 算力相關產品價格上調5%-34% 不等。

  • 百度智能雲: 相關 AI 算力服務上調5%-30%。

結語:AGI 的“時間線”

業內共識認爲,衡量 AGI 的重要指標是任務完成的時間線。前沿模型獨立完成任務的時間每7個月翻一倍。隨着GLM-5.1開啓“8小時工作模式”,大模型正從一個隨問隨答的聊天機器人,正式轉變爲一個能夠深度參與複雜工程的“虛擬員工”。