在最新發佈的 GLM-5.1中,這一開源模型展示了其卓越的智能水平,能夠在長達8小時的任務中獨立工作,完成複雜的工程項目。與之前僅能進行短時間交互的模型相比,GLM-5.1在代碼能力和長程任務執行上都有顯著提升。

該模型在全球開源模型中表現出色,在多個代碼評測基準上取得了優異成績。在 SWE-Bench Pro 基準測試中,GLM-5.1成功定位並修復高難度的工程 Bug,超越了現有的頂級模型,如 GPT-5.4和 Claude Opus4.6。這標誌着其在專業軟件開發領域的強大能力。
GLM-5.1的工作方式讓人驚歎。它能夠在晚上構建一個完整的 Linux 桌面系統,歷時8小時,執行超過1200步,早在20分鐘時便交出了初步成果。最終交付的系統功能完備,相當於四名開發人員一週的工作量。此外,它在向量數據庫優化和真實機器學習負載的自我進化能力方面也表現突出,展現了 AI 在工程領域的潛力。

這款模型的最大亮點在於它能夠自我評估和優化。GLM-5.1在面臨複雜任務時,不僅能識別並解決問題,還能主動調整策略,以實現最佳結果。這種能力爲 AI 在實際應用中的發展提供了新的方向。
GLM-5.1的發佈標誌着一個新的技術時代的開始,開發者們只需給予指令,便能期待它在長時間內的高效工作。
- GitHub:https://github.com/zai-org/GLM-5
- Hugging Face:https://huggingface.co/zai-org/GLM-5.1
- ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5.1
劃重點:
🌟 GLM-5.1能夠在8小時內獨立完成複雜任務,提升了代碼能力。
💻 在多個代碼評測基準上表現卓越,超越了許多頂尖模型。
🔧 具備自我評估與優化能力,展現了 AI 在工程領域的廣泛應用潛力。
