NVIDIAの研究チームは最近、ロボット制御の分野で大きなブレイクスルーを達成しました。彼らが開発したニューラルネットワークシステムHOVERは、非常に少ないパラメーター数で人型ロボットの高効率制御を実現し、専用制御システムを凌駕する性能を示しました。
わずか150万パラメーターのHOVERシステムは、複雑なロボット動作制御を処理できます。これに対し、一般的な大規模言語モデルは数千億パラメーターを必要とします。この驚くべきパラメーター効率は、システム設計の巧妙さを示しています。

HOVERのトレーニングは、NVIDIAのIsaacシミュレーション環境で行われました。この環境では、ロボット動作を1万倍高速化できます。NVIDIAの研究者Jim Fan氏によると、これは仮想空間での1年間のトレーニングを、GPU1台でわずか50分で完了できることを意味します。
システムの大きな特徴は、その優れた適応性です。シミュレーション環境から実ロボットへの移行に特別な調整は不要で、様々な入力方式に対応しています。Apple Vision ProなどのXRデバイスによる頭部と手の動作追跡、モーションキャプチャやRGBカメラによる全身位置データ取得、外骨格による関節角度取得、さらには標準的なゲームパッドによる制御も可能です。
さらに驚くべきことに、HOVERはどの制御方式においても、単一の入力方式向けに開発された専用システムを上回りました。筆頭著者のTairan He氏は、これはシステムがバランス性や精密な肢体制御などの物理的概念を深く理解しているため、異なる制御方式間で知識転移が可能になっているためだと推測しています。
このシステムはオープンソースのH2O & OmniH2Oプロジェクトに基づいて開発されており、Isaacシミュレーターで動作するあらゆる人型ロボットを制御できます。現在、NVIDIAはGitHubでサンプルとコードを公開しており、ロボット研究開発分野に新たな可能性をもたらしています。
