2025 年 11 月 21 日,小米正式發佈並開源業界首個打通自動駕駛與具身智能的跨域基座模型MiMo-Embodied,模型與權重已同步上線Hugging Face與arXiv。

元宇宙 科幻 賽博朋克 繪畫 (4)大模型

技術亮點  

1. 跨域能力覆蓋:同一套參數同時支持具身智能三大任務(可供性推理、任務規劃、空間理解)與自動駕駛三大任務(環境感知、狀態預測、駕駛規劃),實現室內交互與道路決策的統一建模。  

2. 雙向協同賦能:模型驗證了室內交互能力與道路決策能力的知識遷移協同效應,爲跨場景智能融合提供新思路。  

3. 全鏈優化可靠:採用“具身/自駕能力學習→CoT推理增強→RL精細強化”多階段訓練策略,顯著提升真實環境部署可靠性。

性能表現  

在涵蓋感知、決策與規劃的 29 項核心基準測試中,MiMo-Embodied全面優於現有開源、閉源及專用模型:具身智能領域 17 項Benchmark取得SOTA,自動駕駛領域 12 項Benchmark刷新最佳成績,並在通用視覺語言任務上展現卓越泛化能力。

應用與生態  

小米計劃將MiMo-Embodied率先用於自研掃地機器人、工廠AGV及SU7 高階智駕, 2026 年Q1 起通過OTA推送;同時開放模型API,向家居、移動出行、製造業開發者提供跨域智能底座。