ミリメートル単位の正確なアライメント：小米がVLA大規模モデルの後学習フローをオープンソース化

小米は最近、視覚-言語-動作（VLA）大規模モデル「Xiaomi-Robotics-0」の実機後学習プロセスを正式にオープンソース化したことを発表しました。この取り組みは、小米が身体知能分野で重要な一歩を踏み出したことを示しており、ロボットが少量のデータで複雑な操作スキルを迅速に習得できるようにするためのものです。

20時間で「針を通す」技術を習得

事前学習されたベースモデルを基盤として、研究開発チームは約20時間のタスクデータを使用して実機後学習を行い、イヤホンを正確にケースに収める高難度の動作をロボットに習得させました。このプロセスには極めて高い空間認識精度が必要であり、極めて滑らかな表面の微細なずれによる影響も克服しなければなりません。

モデルはミリメートル単位の公差内で対応し、動作のズレをリアルタイムで修正することができます。このような「連続的で滑らかな」実行能力は、Xiaomi-Robotics-0が高精度の組立作業において優れた潜在力を備えていることを証明しています。

オープンソースエコシステムが生産性を進化させる

このモデルを真正に「開封してすぐに使える」ツールにするために、小米はモデルの重みだけでなく、技術報告書とソースコードも公開しました。このフルチェーンのオープンソースモードにより、開発者にとって身体知能分野への参入障壁は大幅に低下しました。

以前から、このモデルは国際的な権威あるプラットフォームで優れたパフォーマンスを発揮しており、グローバルダウンロードランキングの上位にランクインしています。後学習プロセスが公開されることで、世界中の開発者はロボットのセンシングと実行ロジックを共同で最適化し、AIロボットが現実の生産活動や生活に浸透するスピードを加速できます。

プロジェクトサイト: https://robotics.xiaomi.com/xiaomi-robotics-0.html
オープンソースコード: https://github.com/XiaomiRobotics/Xiaomi-Robotics-0

小米新モデル人形ロボットが投資家デーで登場：工場での実証試験に成功、複雑な設置成功率は90％を上回る

小米は4月27日の投資家会議で、新モデルのフルサイズ人形ロボットを控えめに紹介しました。開発は4年間にわたって行われました。このロボットは研究室から工場での実際の作業へと移行し、発表会を経ずに、ギフトの配布や挨拶など高難度の機敏なインタラクションを通じて登場しました。2021年の「鉄蛋（テイダン）」と2022年の「鉄大（テイダ）」に続き、小米は4年間控えめな開発を続けてきましたが、今回の登場は身体知能技術の突破を示しています。

小米が最も強力なモデルシリーズ MiMo-V2.5 を正式にベータテストを開始

小米は4月23日にMiMo-V2.5シリーズの大型モデルを発表し、ベータテストを開始しました。このシリーズには4つのモデルが含まれており、そのうち中心となるモデルであるMiMo-V2.5-ProとMiMo-V2.5は世界中でオープンソース化され、AIエコシステムの開放を推進する意思を示しています。今回のアップデートは製品のイテレーションだけでなく、技術基盤の全面的な刷新でもあります。エントリーレベルの性能では百万単位のコンテキストと複雑なタスク処理をサポートします。

小米 MiMo-V2.5の衝撃的なベータテスト：4.3時間で手作業でコンパイラを作成、長距離スマートエージェントが満点の飛躍を遂げる

小米はMiMo-V2.5シリーズの大モデルを発表し、MiMo-V2.5、V2.5-Proおよび対応するTTSとASRモデルを含んでおり、モデルが「使える」から「使いやすい」へと進化したことを示している。その中でもエース型のMiMo-V2.5-Proは、一般的なスマートエージェント機能とソフトウェアエンジニアリングにおいて、Claude Opus4.6やGPT-5.4などのトップモデルと競合できる水準に達しており、主な強みは高い指示従従性と自己修正能力である。

中国製エージェントエコシステムの爆発的成長！小米 MiMo-V2 がトップレベルなフレームワークである Hermes に接続し、14日間の限定無料体験をスタート

小米の自社開発の大規模モデル MiMo-V2 シリーズが、世界トップクラスのオープンソースエージェントフレームワークである Hermes Agent に正式に接続され、強力な連携を実現しました。開発者はフレームワークを更新することで、Nous Portal を直接利用して小米のフラッグシップモデルを使用できます。また、小米は開発者への感謝として、2週間の限定無料体験「オールインワン・フリープレミアム」キャンペーンを開始しました。

小米が本格的にオープンソース！OmniVoiceは600種以上の言語をカバーし、ゼロサンプルの音声クローンTTS：WERは0.84%に達し、40倍速く動作し、小語種も簡単に復活