ロボット技術は、「産業自動化」から「物理AI」への転換点を迎えています。IT之家の情報によると、マイクロソフト研究室は新しいAIモデル「Rho-alpha」を正式に発表しました。このモデルは、ロボットが閉鎖的で予め設定された環境に依存することを打破し、複雑で変化しやすい予測困難な現実的なシナリオにおいて活躍できるようにするものです。

マイクロソフト「物理AI」戦略の中心的な成果であるRho-alphaは、驚くべき相互作用能力を示しています。これは、人間の自然言語指令を直接正確な制御信号に変換し、非常に複雑な両手協働タスクをロボットに実行させることが可能です。これにより、将来的にはロボットが難解なコードスクリプトを学ぶ必要がなくなり、一言で人のように理解し操作できます。
認識面では、Rho-alphaはさらに進んでいます。Phiシリーズの優れた視覚と言語処理の特徴を引き継いでいるだけでなく、初めて本格的に触覚感知を統合しました。ロボットが物体を掴む際、リアルタイムに触感フィードバックに基づいて動作の力や姿勢を微調整します。マイクロソフトは、今後は力感知などの新たなモダリティを追加し、ロボットの操作精度をさらに高める予定です。
ロボットをより「賢く」、使いやすくするために、Rho-alphaは動的な行動調整メカニズムを導入しています。実際に運用中にロボットの性能が不十分な場合、人間のオペレーターは3D入力デバイスを通じて介入・修正を行い、システムはそのフィードバックをリアルタイムで学習プロセスに吸収します。Azureインフラストラクチャによって生成される膨大なシミュレーションデータと現実世界の実演データの融合により、Rho-alphaは進化を加速しており、ユーザーの好みを真正に理解するスマートなアシスタントになることを目指しています。
重要なポイント:
🗣️ 言語直接制御: Rho-alphaモデルは自然言語とロボット制御信号の直接変換を実現し、複雑な両手協働操作をサポートし、従来の予め設定されたスクリプトの束縛から解放されます。
🖐️ 触覚の進化: このモデルは視覚の基礎上に触覚フィードバック機構を導入し、ロボットが実際の触感に基づいて行動をリアルタイムで調整できるようにし、今後は力感知モダリティを追加して精度を向上させます。
🔄 継続的な学習: システムは人間によるリアルタイムの介入と修正をサポートし、3D入力デバイスを通じてユーザーの好みを学び、シミュレーションデータと現実データを組み合わせて非構造化環境におけるパフォーマンスを常に最適化します。
