北京智譜華章科技有限公司近日宣佈其旗下的智譜 GLM-PC 智能體已進行升級,並正式向公衆開放體驗。作爲全球首個可以自主操作計算機的多模態智能體,GLM-PC 的技術基礎是智譜的多模態大模型 CogAgent。用戶只需簡單的回車操作,即可體驗這一革新性的電腦智能助手。

自2024年11月29日 GLM-PC v1.0發佈以來,它就一直處於內測階段。這一版本帶來了 “深度思考” 模式,新增了邏輯推理和代碼生成功能,同時也對 Windows 系統進行了支持。GLM-PC 的能力涵蓋了代碼生成、邏輯執行、圖形用戶界面(GUI)理解等多個方面,展現了其在智能化操作上的強大潛力。

image.png

在代碼生成和邏輯執行方面,GLM-PC 具備綜合分析目標與資源的能力,能夠生成執行路線圖,將大型任務分解爲小型可管理的子任務,實現高效的任務規劃。任務規劃完成後,智能體可啓動代碼生成模塊進行循環執行,確保任務的精準完成。同時,GLM-PC 還擁有長思考能力,能夠實時調整和反思修正,並與用戶互動,優化解決方案。

在圖像和 GUI 認知方面,GLM-PC 能夠準確識別和理解圖形界面中的元素,如按鈕和圖標,並結合用戶的歷史操作信息提供智能推薦。其圖像語義解析功能則可以深入分析複雜圖像,提取關鍵信息,如趨勢和指標。此外,GLM-PC 還可以融合圖像與文字信息,爲用戶提供全面的感知結果,幫助用戶制定精準的操作計劃。

隨着人工智能技術的不斷髮展,智譜 GLM-PC 的推出無疑爲用戶帶來了更高效、智能的電腦使用體驗,標誌着人機交互的一個重要進步。