智譜今日宣佈正式開源其核心 AI Agent 模型 AutoGLM,這一具備“Phone Use”能力的智能體能夠穩定完成外賣點單、機票預訂等長達數十步的複雜手機操作流程。開源意味着任何硬件廠商、手機廠商及開發者,都可以在自己的系統中復現一個能“看懂屏幕”、並能像真人一樣完成點擊、輸入、滑動等操作的 AI 助手。

玩手機,移動互聯網

AutoGLM 已支持包括微信、淘寶、抖音在內的超過50款高頻中文應用的核心場景,其演示效果與此前引發行業關注的“豆包手機”極爲相似:用戶無需手動操作,只需讓 AI 觀察屏幕內容,它便可以自動執行任務、連續完成多步驟操作並直達結果。與其他智能體方案相比,AutoGLM 的優勢在於穩定性與複雜流程處理能力,尤其適合在真實手機環境中執行長鏈條任務。

這一開源動作將顯著降低 AI 手機的技術門檻,讓“AI 能替你操作手機”不再是頭部廠商的專屬技術,而成爲行業共同可構建的能力,推動 AI 手機生態從封閉走向開放,促使更多設備具備系統級智能體體驗。AutoGLM 同時支持本地與雲端部署,爲廠商保留最大化的數據與隱私控制權,也意味着用戶未來有機會在無需上傳隱私數據的前提下獲得同等的智能體驗。

對於正試圖打造下一代系統級 AI 的手機廠商而言,AutoGLM 的開源無疑是一項戰略級補全;對於開發者,它則提供了一個可復現、可修改、可擴展的完整智能體能力底座。隨着更多廠商加入生態,這類具備真實交互能力的 AI Agent 可能會加速成爲未來手機的標配能力。