近日,上海交通大學的 IPADS 實驗室團隊推出了一款名爲 MobiAgent 的全新移動端智能體工具鏈,打破了個人化智能助手的開發壁壘,聲稱其真實場景表現優於 GPT-5和其他頂級閉源模型。

MobiAgent 的推出讓每個人都有機會培養屬於自己的 AI 助手。這個工具鏈支持用戶從零開始構建移動端智能體,包括從收集操作數據到訓練模型,再到將模型部署到手機上的完整流程。MobiAgent 的開源性質,意味着用戶可以自主獲取數據、訓練模型,並在個人設備上實現智能助手的應用。

image.png

爲了驗證 MobiAgent 的實際能力,研究團隊在國內20款熱門應用中進行了測試,結果顯示,7B 規模的 MobiAgent 模型在任務完成評分上,不僅超越了多款知名閉源大模型,甚至在同規模的開源 GUI 智能體中也處於領先地位。MobiAgent 獨特的 “潛記憶加速器” 能夠通過學習歷史操作,幫助智能體快速完成重複任務,性能提升達到2-3倍。

MobiAgent 的核心在於其高效的數據收集和智能訓練流程。它通過輕量級工具記錄用戶的手機操作,然後利用通用 VLM 模型生成高質量的訓練數據。這些數據經過精煉調整,確保訓練出的智能體具有出色的泛化能力。MobiAgent 的 “大腦” 被分爲三部分:負責任務規劃的 “規劃師”、根據當前屏幕做出決策的 “決策者” 以及執行具體操作的 “執行者”。這樣的架構讓模型訓練更加高效,反應速度大幅提升。

通過創新的 AgentRR 加速框架,MobiAgent 能夠藉助以往的操作經驗,大幅提升重複任務的執行效率,最高可實現60%-85% 的動作複用率。這使得智能助手在處理日常事務時更加迅速、準確。

MobiAgent 的推出不僅爲個人智能助手的定製化提供了便利,更是推動了整個移動智能體生態的發展,標誌着 “能動口就不動手” 的智能時代即將到來。

論文地址:https://arxiv.org/pdf/2509.00531