智譜AI推出AutoGLM智能體：輸入指令即可模擬人類操作手機

智譜技術團隊最近推出了一個基於GLM技術團隊研究成果的新產品——AutoGLM，這是一個智能體（Agent），能夠模擬人類操作手機，執行各種任務。AutoGLM的推出標誌着人工智能在“Phone Use”領域的進步，使得AI的應用更加貼近人們的日常生活。

微信截圖_20241026150533.png

AutoGLM能夠執行多種任務，如在微信上點贊並評論朋友圈、在淘寶上購買歷史訂單產品、在攜程上預訂酒店、在12306上購買火車票、在美團上點外賣等。它的應用場景不僅限於此，理論上，AutoGLM可以完成人類在可視化電子設備上能做的任何事，操作邏輯與人類類似，無需複雜的工作流搭建。

目前，用戶可以通過安裝“智譜清言”插件體驗AutoGLM-Web，這是一個瀏覽器助手，能夠模擬用戶訪問網頁、點擊網頁，並在網站上自動完成高級檢索、總結與內容生成。此外，AutoGLM也在安卓系統上開放了內測申請，並與榮耀等手機廠商開展了深度合作。

微信截圖_20241026150714.png

AutoGLM的技術基於智譜自研的“基礎智能體解耦合中間界面”和“自進化在線課程強化學習框架”，解決了大模型智能體任務規劃和動作執行中的能力拮抗、訓練任務和數據稀缺、反饋信號稀少和策略分佈漂移等問題。AutoGLM能夠不斷自我改進、持續穩定地提高自身性能，類似於人在成長過程中不斷獲取新技能。

在技術挑戰方面，AutoGLM解決了“動作執行”不夠精確和“任務規劃”不夠靈活的問題。它通過“基礎智能體解耦合中間界面”設計，將“任務規劃”與“動作執行”兩個階段通過自然語言中間界面進行解耦合，實現了智能體能力的極大提升。同時，AutoGLM採用了“自進化在線課程強化學習框架”，在真實在線環境中學習和提升大模型智能體在Web和Phone環境中的能力。

AutoGLM在Phone Use和Web Browser Use上都取得了顯著的性能提升，並在AndroidLab評測基準上超越了GPT-4o和Claude-3.5-Sonnet的表現。在WebArena-Lite評測基準中，AutoGLM相對GPT-4o取得了約200%的性能提升，縮小了人類和大模型智能體在GUI操控上的成功率差距。

項目地址:https://xiao9905.github.io/AutoGLM

螞蟻集團發佈 AMP 協議，打通全球智能體支付新鏈路

人工智能正推動商業邏輯從用戶手動操作向智能體授權執行轉變。智能體成爲搜索、決策和購物的新入口，但支付環節的便捷與安全仍是關鍵挑戰。爲此，螞蟻集團發佈移動智能體協議（AMP），旨在爲這一新興商業形態構建可信、高效的支付基礎設施。

騰訊發佈首個智能體行業應用LearnBuddy，打造專家同行的AI自主學習平臺

騰訊雲在AI產業應用大會上發佈教育智能體LearnBuddy，這是Buddy家族首款行業應用。該產品基於WorkBuddy同源技術，深度融合智能體平臺與教育場景，打造“師—生—機”三元協同的AI自主學習平臺，推動教育智能體從工具向知識資產演進。同時，騰訊還推出企業效率智能體套件並升級Agent雲底座，加速AI在教育領域的產業化落地。

速度翻倍！階躍星辰開源 Step 3.7 Flash 大模型

階躍星辰發佈並開源新一代Flash模型Step 3.7 Flash，專爲智能體生產化落地設計。該模型採用196B參數的稀疏混合專家架構，針對代碼編寫、聯網搜索及多模態工作流進行系統級優化，最高生成速度達每秒400 Tokens，顯著提升高頻場景效率，標誌着國內大模型賽道取得新突破。

智譜AI推出AutoGLM智能體：輸入指令即可模擬人類操作手機

相關推薦

AI 進化的下一塊拼圖：GPT-5.6 或於下週登場，主打“Agent”級操作能力

螞蟻集團發佈 AMP 協議，打通全球智能體支付新鏈路

騰訊發佈首個智能體行業應用LearnBuddy，打造專家同行的AI自主學習平臺

能力與安全的博弈！OpenAI 上線 ChatGPT“封鎖模式”，寧可斷網也要防數據泄露

速度翻倍！階躍星辰開源 Step 3.7 Flash 大模型