小米開源跨域具身大模型MiMo-Embodied：29項基準刷新SOTA，自駕+家用場景一套權重通吃

2025 年 11 月 21 日，小米正式發佈並開源業界首個打通自動駕駛與具身智能的跨域基座模型MiMo-Embodied，模型與權重已同步上線Hugging Face與arXiv。

元宇宙科幻賽博朋克繪畫 (4)大模型

技術亮點

1. 跨域能力覆蓋：同一套參數同時支持具身智能三大任務（可供性推理、任務規劃、空間理解）與自動駕駛三大任務（環境感知、狀態預測、駕駛規劃），實現室內交互與道路決策的統一建模。

2. 雙向協同賦能：模型驗證了室內交互能力與道路決策能力的知識遷移協同效應，爲跨場景智能融合提供新思路。

3. 全鏈優化可靠：採用“具身/自駕能力學習→CoT推理增強→RL精細強化”多階段訓練策略，顯著提升真實環境部署可靠性。

性能表現

在涵蓋感知、決策與規劃的 29 項核心基準測試中，MiMo-Embodied全面優於現有開源、閉源及專用模型：具身智能領域 17 項Benchmark取得SOTA，自動駕駛領域 12 項Benchmark刷新最佳成績，並在通用視覺語言任務上展現卓越泛化能力。

應用與生態

小米計劃將MiMo-Embodied率先用於自研掃地機器人、工廠AGV及SU7 高階智駕， 2026 年Q1 起通過OTA推送；同時開放模型API，向家居、移動出行、製造業開發者提供跨域智能底座。

機器人進化新引擎：阿里發佈具身智能大模型Qwen-Robot系列

阿里巴巴於6月16日發佈千問具身智能大模型Qwen-Robot系列，旨在解決機器人理解自然語言、感知三維環境及掌握物理規律的核心難題。該系列包含三款核心模型，可獨立或協同工作，爲機器人提供通用技術底座，推動具身智能從實驗室邁向真實複雜環境。

英國AI巨頭Wayve啓動 8500 萬美元員工套現計劃，估值飆升至 85 億美元