金山雲宣佈其星流訓推平臺已全面接入智譜 GLM 系列推理模型,成爲首批接入該系列推理模型的平臺之一。這一舉措標誌着金山雲在 AI 領域的進一步拓展,爲用戶提供更加高效、智能和更具性價比的模型服務。
智譜 GLM 系列推理模型是國產 AI 大模型獨角獸智譜於日前正式開源的,涵蓋基座、推理、沉思模型,均遵循 MIT 許可協議。其中,GLM-Z1-32B-0414是具有深度思考能力的推理模型,相較其32B 基座模型提升了數理能力和解決複雜任務的能力。在 AIME24/25、LiveCodeBench、GPQA 等基準測試中,GLM-Z1-32B-0414在數理推理能力、指令遵循能力和綜合工具調用能力等方面表現突出。此外,智譜還訓練了一個9B 的小尺寸模型,雖然參數量更少,但在數學推理及通用任務上依然表現優異。
金山雲星流訓推平臺聚焦高效部署與分佈式推理協同,提供從模型部署到調用的服務能力。通過智能任務調度與跨節點並行計算,該平臺能夠實現模型的高效推理。用戶無需複雜配置,即可在公有云環境構建穩定、高性價比的模型服務。接入 GLM 系列推理模型後,金山雲星流訓推平臺的部署流程更加簡化,用戶可以通過控制檯創建資源池、進入模型在線服務導航頁、新建模型在線服務,並自主配置服務副本數等基本信息、資源和網絡配置,完成模型部署。部署完成後,用戶可以選擇內網、公網調用或在線調試等方式調用模型服務,也可以通過 WebUI 調用模型。
此前,金山雲星流訓推平臺已完成 DeepSeek 等多款大模型部署。通過接入更多優質大模型,金山雲將爲各領域客戶提供更加高效、智能和更具性價比的模型服務。這一舉措不僅提升了金山雲在 AI 領域的服務能力,也爲開發者和企業用戶提供了更多選擇,推動了 AI 技術的廣泛應用和發展。