小米はロボット技術分野で再度「大物」を投じました。今年2月にそのVLAモデルXiaomi-Robotics-0をリリースし、オープンソース化した後、本日、このモデルの実機後のトレーニング(Post-training)全体プロセスを正式に公開しました。この取り組みは、ロボットが研究室から実際の生産へと移行する「最後の1マイル」問題を解決することを目的としており、AIロボットが開封してすぐに使える生産性ツールとなることを目指しています。

最新の機能デモでは、このモデルを搭載したロボットが驚くべき細かい操作能力を示しました。わずか20時間のタスクデータ強化トレーニングを通じて、Xiaomi-Robotics-0は「連続してイヤホンを収納する」という非常に難しい動作を成功させました。画面上では、ロボットの動作が滑らかで、小さなイヤホンを一つずつ密な収納ケースのスロットに正確に挿入できることがわかります。
このように見える単純な動作には、実は技術的な難関が隠れています。公式の技術資料によると、このタスクには2つの主要な技術的障壁があります。第一に精度の課題です。イヤホンと充電ケースのスロットとの公差は極めて微細で、モデルがミリメートル以下の空間認識能力を持つことでなければ正確に位置合わせできません。第二に安定性の課題です。イヤホンとケース表面は非常に滑らか(粗さはRa0.03μmまで)で、接触時に簡単に滑って位置がずれてしまうため、モデルは極めて高いリアルタイムフィードバックと動作修正能力を持ち、アセンブリ失敗を防ぐ必要があります。

注目すべき点は、Xiaomi-Robotics-0がリリースしてから1か月以内にHuggingFaceの世界中のVLAモデルダウンロードランキング上位6位に入るほど、業界からの高い注目を集めていることです。さらに開発者エコシステムの構築を推進するために、現在、マイクロソフトはプロジェクトの技術報告書、モデルの重み付けおよびソースコードをすべて公開しています。
現在、開発者はマイクロソフトロボティクス技術ウェブサイトやGitHubなどのオープンソースプラットフォームを通じて関連リソースを取得できます。後処理フローのオープンソース化により、業界は高性能ロボットタスクの開発コストを大幅に低下させ、複雑で繊細なシナリオでのスマートロボットの応用が加速すると予測しています。
技術ウェブサイト:https://robotics.xiaomi.com/xiaomi-robotics-0.html#pack-earbuds
