2025年1月23日,全球首個面向公衆的、回車即用的電腦智能體GLM-PC再次升級,引發廣泛關注。GLM-PC基於智譜多模態大模型CogAgent,能像人類一樣“觀察”和“操作”計算機,協助用戶高效完成各類電腦任務。
自2024年11月29日發佈GLM-PC v1.0並開放內測以來,該智能體不斷優化升級。最新推出的“深度思考”模式,增加了邏輯推理和代碼生成功能,使得GLM-PC在處理複雜任務時更加得心應手。此外,GLM-PC還實現了對Windows系統的支持,進一步拓寬了其應用場景。
GLM-PC的架構設計充分考慮了Agent的模型能力提升與協作架構優化。一個完備的Agent需滿足在感知層面接收文字、圖像、視頻、音頻等多元信號;在思維層面具備邏輯思維、任務規劃能力及高效感知、靈活操作能力;在執行層面能完成全GUI空間操作,接收環境反饋並自我糾正。GLM-PC借鑑人類“左腦”與“右腦”分工,通過代碼生成與圖形界面理解,實現邏輯推理與感知認知的深度結合,賦予其在邏輯性與創造性間平衡的能力。
在實際應用中,GLM-PC展現了強大的功能。其“左腦”負責嚴謹的邏輯推理與任務執行,能夠迅速制定出詳細的任務規劃方案,並通過循環執行機制確保任務的精確執行與高度自動化。例如,GLM-PC能夠自動提取圖片中的商品數據,存儲至Excel,並自動將商品加入淘寶購物車,實現一站式購物流程。其“右腦”則專注於深度感知與交互體驗,能夠準確識別圖形界面元素,理解用戶行爲,對複雜圖像進行深入語義分析,並融合圖像與文字信息形成全面感知結果。這使得GLM-PC在數據整理、信息提取等方面表現出色。
值得一提的是,GLM-PC還展示了左右腦協作的強大能力。在處理複雜邏輯任務的同時,GLM-PC還能在開放性問題上展現更高的適應能力、創造力和泛化能力。通過動態優化和情境感知,GLM-PC能夠幫助用戶探索更高效的解決方案,特別是在循環任務處理、多步推理執行以及長鏈條任務管理等方面。
此外,智譜還在積極推動GLM-PC與知名PC廠商的合作,共同推動AIPC(AI個人電腦)的創新與發展。AIPC不僅是一臺電腦,更是AI Agent在個人計算領域的全新應用,能夠爲用戶提供更高效、更智能的工作與生活體驗。
下載&體驗:https://cogagent.aminer.cn