小米がVLA大モデルをオープンソース化した後、ロボットのミリメートル単位での操作が現実となる

小米はロボット技術分野で再度「大物」を投じました。今年2月にそのVLAモデルXiaomi-Robotics-0をリリースし、オープンソース化した後、本日、このモデルの実機後のトレーニング（Post-training）全体プロセスを正式に公開しました。この取り組みは、ロボットが研究室から実際の生産へと移行する「最後の1マイル」問題を解決することを目的としており、AIロボットが開封してすぐに使える生産性ツールとなることを目指しています。

最新の機能デモでは、このモデルを搭載したロボットが驚くべき細かい操作能力を示しました。わずか20時間のタスクデータ強化トレーニングを通じて、Xiaomi-Robotics-0は「連続してイヤホンを収納する」という非常に難しい動作を成功させました。画面上では、ロボットの動作が滑らかで、小さなイヤホンを一つずつ密な収納ケースのスロットに正確に挿入できることがわかります。

このように見える単純な動作には、実は技術的な難関が隠れています。公式の技術資料によると、このタスクには2つの主要な技術的障壁があります。第一に精度の課題です。イヤホンと充電ケースのスロットとの公差は極めて微細で、モデルがミリメートル以下の空間認識能力を持つことでなければ正確に位置合わせできません。第二に安定性の課題です。イヤホンとケース表面は非常に滑らか（粗さはRa0.03μmまで）で、接触時に簡単に滑って位置がずれてしまうため、モデルは極めて高いリアルタイムフィードバックと動作修正能力を持ち、アセンブリ失敗を防ぐ必要があります。

注目すべき点は、Xiaomi-Robotics-0がリリースしてから1か月以内にHuggingFaceの世界中のVLAモデルダウンロードランキング上位6位に入るほど、業界からの高い注目を集めていることです。さらに開発者エコシステムの構築を推進するために、現在、マイクロソフトはプロジェクトの技術報告書、モデルの重み付けおよびソースコードをすべて公開しています。

現在、開発者はマイクロソフトロボティクス技術ウェブサイトやGitHubなどのオープンソースプラットフォームを通じて関連リソースを取得できます。後処理フローのオープンソース化により、業界は高性能ロボットタスクの開発コストを大幅に低下させ、複雑で繊細なシナリオでのスマートロボットの応用が加速すると予測しています。

技術ウェブサイト：https://robotics.xiaomi.com/xiaomi-robotics-0.html#pack-earbuds

ロボット進化の新エンジン：アリババが身体知能大モデルQwen-Robotシリーズを発表

アリババは6月16日、ロボットが自然言語を理解し、3次元環境を認識し、物理法則を習得する核心的な課題を解決するために、Qwen-Robotシリーズの具身智能大規模モデルを発表した。このシリーズは3つのコアモデルを含み、独立または連携して動作可能で、ロボットに汎用技術基盤を提供し、具身智能を実験室から現実の複雑な環境へと押し上げることを目指している。....

3年間で600億を投資し、AIに力を入れる。小米の大規模モデルが世界で2つのランキングで第1位を獲得し、スマート化転換を加速する

小米グループの雷軍会長は5月26日、2026年第1四半期の研究開発費が90億元で前年同期比33.4%増加し、研究開発人員は2.6万人を超え、年間の研究開発費は400億元を突破する見込みであることを明らかにした。自社開発の大規模モデル「Xiaomi MiMo-V2.5-Pro」は、Artificial Analysisのランキングで総合知能指数とAgent指数の両方で世界のオープンソースモデルと並んで1位を獲得した。....

アルファベットのロボット先進企業インスチチュートが正式にグーグルのコアビジネスに統合

2026年2月25日、グーグルはアルファベット傘下のロボットソフトウェア会社インスチチュートを自社に統合することを発表した。これは、最高水準のAIモデルとインフラストラクチャを統合し、ロボット技術を工業製造分野で広く普及させるためのものである。インスチチュートは独立して運営されるが、研究開発の重点はグーグル・ディープマインドとの深い協力に移行し、ジーニーAIモデルおよびグーグルクラウドサービスを全面的に利用して、ロボット技術の発展を推進する。

小米がオープンソースで初のロボットVLA大モデルを開発、物理的インテリジェンスの遅延のバッファを突破

小米が47億パラメータのロボットモデルXiaomi-Robotics-0をオープンソース化し、MoTミックスアーキテクチャを採用。脳と小脳が協力して働き、モバイル向けGPUでリアルタイム推論を実現し、現在のVLAモデルが推論遅延によって動作が鈍くなる問題を解決し、ロボットの制御効率と汎化能力を向上させました。

ユニバーサル・ロボティクスがオープンソースのThinker大モデルを公開し、産業用人型ロボットの新しい未来を実現