智譜技術團隊宣佈開源32B 和9B 系列的 GLM(General Language Model)模型,並正式上線了全新的交互體驗平臺 Z.ai。這一系列模型包括基座模型、推理模型和沉思模型,均遵循寬鬆的 MIT 許可協議,爲開發者提供了極大的使用和開發自由度,可免費用於商業用途和自由分發。
此次開源的32B 基座模型 GLM-4-32B-0414擁有320億參數,利用15T 高質量數據進行預訓練,特別納入了豐富的推理類合成數據。在後訓練階段,通過拒絕採樣和強化學習等技術,該模型在指令遵循、工程代碼生成、函數調用等任務上的表現得到了顯著增強,部分 Benchmark 指標已接近甚至超越了 GPT-4o、DeepSeek-V3-0324(671B)等更大模型的水平。此外,GLM-4-32B-0414還進一步提升了代碼生成能力,可處理並生成結構更復雜的單文件代碼,Z.ai 的對話模式內建了預覽功能,支持對生成的 HTML 和 SVG 進行可視化查看,便於用戶評估生成結果和進行迭代優化。
推理模型 GLM-Z1-32B-0414在 GLM-4-32B-0414的基礎上,採用了冷啓動與擴展強化學習策略,並針對數學、代碼、邏輯等關鍵任務進行了深度優化訓練。該模型在部分任務上的性能已能與擁有671B 參數的 DeepSeek-R1相媲美,展現了較強的數理推理能力,能夠支持解決更廣泛複雜的任務。值得一提的是,GLM-Z1-32B-0414的實測推理速度可達200Tokens/秒,是國內目前商業模型中速度最快的,其價格僅爲 DeepSeek-R1的1/30。
9B 尺寸的 GLM-Z1-9B-0414模型沿用了上述一系列技術,雖然參數量更少,但在數學推理及通用任務上依然表現出色,整體性能已躋身同尺寸開源模型的領先水平。特別是在資源受限的場景下,該模型可以很好地在效率與效果之間取得平衡,爲需要輕量化部署的用戶提供強有力的選擇。
沉思模型 GLM-Z1-Rumination-32B-0414代表了智譜對 AGI(Artificial General Intelligence,通用人工智能)未來形態的下一步探索。與一般推理模型不同,沉思模型通過更多步驟的深度思考來解決高度開放與複雜的問題。其關鍵創新在於,它能在深度思考過程中整合搜索工具處理複雜任務,並運用多種規則型獎勵機制來指導和擴展端到端的強化學習訓練。該模型支持“自主提出問題—搜索信息—構建分析—完成任務”的完整研究閉環,從而在研究型寫作和複雜檢索任務上的能力得到了顯著提升。
除模型開源外,基座、推理兩類模型也已同步上線智譜 MaaS 開放平臺(bigmodel.cn),面向企業與開發者提供 API 服務。本次上線的基座模型提供兩個版本:GLM-4-Air-250414和 GLM-4-Flash-250414,其中後者完全免費。上線的推理模型分爲三個版本,分別滿足不同場景需求:GLM-Z1-AirX(極速版)定位國內最快推理模型,推理速度可達200tokens/秒,比常規快8倍;GLM-Z1-Air(高性價比版)價格僅爲 DeepSeek-R1的1/30,適合高頻調用場景;GLM-Z1-Flash(免費版)支持免費使用,旨在進一步降低模型使用門檻。
與此同時,智譜啓用了全新域名 Z.ai,該平臺整合了32B 基座、推理、沉思三類 GLM 模型,作爲智譜最新模型的交互體驗入口,目前已上線三款開源模型,用戶可以在該平臺上免費體驗這些模型的強大功能。