2025年11月21日、小米は業界初の自律走行とエージェント型インテリジェンスを統合したクロスドメインベースモデル「MiMo-Embodied」を正式に発表し、オープンソース化しました。モデルと重みはHugging FaceおよびarXivにも同時に公開されています。

メタバース サイエンスフィクション サイバーパンク 絵画 (4) ビッグモデル

技術的特徴  

1. ドメインカバー範囲:同じパラメータでエージェント型インテリジェンスの3つの主要タスク(可能性推論、タスク計画、空間理解)と自律走行の3つの主要タスク(環境認識、状態予測、運転計画)をサポートし、室内インタラクションと道路意思決定の統一モデリングを実現します。

2. 双方向協力向上:モデルは室内インタラクション能力と道路意思決定能力の知識移行協同効果を検証し、クロスシーンのインテリジェンス統合に新しいアプローチを提供します。

3. 全フロー最適化信頼性:「エージェント/自動運転能力学習→CoT推論強化→RL精細強化学習」の多段階トレーニング戦略を採用し、現実環境への導入信頼性を大幅に向上させます。

性能表現  

感覚・意思決定・計画を含む29の主要ベンチマークテストにおいて、MiMo-Embodiedは既存のオープンソース、クローズドソース、専用モデルをすべて上回っています。エージェント型インテリジェンス分野では17のベンチマークでSOTAを達成し、自律走行分野では12のベンチマークで最高記録を更新し、一般的なビジュアル言語タスクにおいても優れた汎化能力を示しています。

応用とエコシステム  

小米はMiMo-Embodiedを自社開発のロボット掃除機、工場AGV、SU7の高級スマートドライビングに最初に適用し、2026年第1四半期からOTAアップデートで提供する予定です。また、モデルAPIを公開し、ホーム、モバイル移動、製造業の開発者に対してクロスドメインのインテリジェンス基盤を提供します。