報道によると、智元ロボットは新世代のエージェントベース大モデル Genie Operator-2(略称 GO-2) を正式に発表しました。このモデルの核心的な使命は、「論理的推論」から「正確な動作実行」までの最後の1キロメートルを完全に打通することです。ロボットが命令を理解するだけでなく、安定してタスクを遂行できるようにすることを目指しています。

image.png

コア技術: 世界初の「アクション・チェーン・オブ・シンス」(Action Chain-of-Thought)

GO-2は、新たなインタラクティブなロジックを導入し、ロボットの思考方法を完全に変革しました:

  • 「見ながら動く」ことを拒否:従来モデルが直接制御信号を出力するのとは異なり、GO-2はまず頭の中で高次の動作シーケンスを生成し、タスク全体の計画として扱います。

  • 考えた後に動く: この構造化された中間表現により、ロボットは「感知入力」から「動作空間の推論」への飛躍を実現しました。関連技術成果はAI頂点会議 CVPR2026 に採択されています。

構造革新: 非同期二重システムで「実行がずれない」を確保

ロボットの実行過程における安定性問題を解決するために、智元は精密な協調的な非同期システムを構築しました:

  • 遅いシステム(知恵):低頻度で動作し、長距離論理に基づいた動作計画の「意図の流れ」を継続的に出力します。

  • 速いシステム(筋肉):高頻度で動作し、遅いシステムの計画にリアルタイムで対応します。デスクの高さの誤差や物体の滑りなどが発生した場合、瞬時に修正を行い、最終的な動作が予定された軌跡に一致することを確保します。

実績優秀: 複数の基準テストでSOTA記録を更新

具身知能の実力を測る権威あるテストにおいて、GO-2は統治的なパフォーマンスを示しました:

  • LIBERO Benchmark: 平均成功確率は 98.5% で、4つの主要なタスクすべてで世界第1位を獲得しました。

  • Genie Sim3.0: シミュレーションデータのみでトレーニングを行った場合でも、本物の環境でのテスト成功確率は 82.9% に達し、競合モデル(例:π0.5)よりも優れています。

産業ビジョン: 「研究室」から「生産ライン」へ

智元ロボットは、単なるモデルの発表だけでなく、閉ループの学習体系も構築しました:

  • 分散進化:Genie Studioプラットフォームを活用し、モデルは実際の環境で継続的にインタラクティブなデータを収集し、オンラインで最適化することで、「使うほど賢くなる」ようになります。

  • 汎用的な脳:GO-2の目標は、具身知能の汎用的な脳となり、ロボットが仮想シミュレーションから複雑な産業展開の場面へスムーズに移行できるようにすることです。

結論: 「知行合一」のロボット時代を開く

智元公式が述べたように、具身知能の究極的な追求は理解と実行の統一です。GO-2の実装によって、ロボットはただ紙の上で話す「思考者」から、物理世界を正確に変える「実行者」へと進化しています。