最新の研究で、MimicGenシステムが発表されました。このシステムはデジタルツイン技術を用いて、シミュレーション環境において大規模なロボット訓練データを作成します。
わずか200回に満たない人間のデモンストレーションだけで、5万件もの訓練データを自動生成し、18種類のタスクを網羅しています。
この手法は、合成データとシミュレーションをAI開発に応用することで、事実上無限の訓練データを提供します。これはロボット分野を始め、他のAI分野にとっても非常に重要な意味を持ちます。

最新の研究で、MimicGenシステムが発表されました。このシステムはデジタルツイン技術を用いて、シミュレーション環境において大規模なロボット訓練データを作成します。
わずか200回に満たない人間のデモンストレーションだけで、5万件もの訓練データを自動生成し、18種類のタスクを網羅しています。
この手法は、合成データとシミュレーションをAI開発に応用することで、事実上無限の訓練データを提供します。これはロボット分野を始め、他のAI分野にとっても非常に重要な意味を持ちます。
テスラおよびSpaceXのCEOであるイーロン・マスク氏は最近のライブ対談で、人工知能モデルの訓練に使用できる現実世界のデータはほぼ枯渇していると述べました。対談相手はStagwellの会長マーク・ペイン氏です。マスク氏は、「我々は基本的に、人類の知識の蓄積…AI訓練用のデータを使い果たしてしまいました。この現象は基本的に昨年起こったのです。」と述べました。マスク氏のこの見解は、元OpenAI主席科学者のイリヤ・スツケベル氏の見解と一致しています。
将来、ヒューマノイドロボット市場は380億ドル規模に達すると予想されています。特に産業や製造分野におけるこの巨大な市場需要に応えるため、NVIDIAは先日、次世代ヒューマノイドロボットの開発を加速させる、一連のロボット基礎モデル、データパイプライン、シミュレーションフレームワークを発表しました。NVIDIAの創業者兼CEOであるジェンスン・フアン氏はCESで、合成モーション生成を通じて開発者が模倣学習を用いて大量の合成モーションデータを作成し、ヒューマノイドロボットのトレーニングを支援するIsaac GR00Tの青写真を公開しました。
深層学習の急速な発展は、大規模なデータセット、モデル、計算量に依存しています。自然言語処理やコンピュータビジョン分野では、研究者らはモデル性能とデータ規模の間に冪乗則関係があることを発見しました。しかし、ロボット分野、特にロボット操作分野では、同様の大規模な法則はまだ確立されていません。清華大学の研究チームは最近、論文を発表し、ロボット模倣学習におけるデータ規模の法則を探求し、効率的なデータ収集戦略を提案しました。この戦略により、たった半日で十分なデータを収集し、…
マサチューセッツ工科大学(MIT)は今週、特定のデータセットに焦点を当てた従来の訓練方法を放棄し、大規模言語モデル(LLM)の訓練で用いられるような膨大な情報を使用する、全く新しいロボット訓練モデルを発表しました。研究者らは、模倣学習 ― エージェントがタスクを実行する個体を模倣することで学習する手法 ― は、わずかな課題に対しても失敗する可能性があると指摘しています。これらの課題には、異なる照明条件、異なる環境設定、新たな障害物などが含まれます。これらの状況において、ロボットは変化に適応するための十分なデータを持っていないのです。
MITは今週、模倣学習が小さな課題でも失敗する可能性がある問題に対処することを目的とした、ロボットの新しいトレーニングモデルを発表しました。研究者らは、照明、異なる環境、新しい障害物などの状況下では、ロボットが適応するための十分なデータがないため、模倣学習が失敗する可能性があると指摘しています。そこで研究チームは、GPT-4のようなモデルを活用し、この問題に対する強力なデータ手法を見つけ出そうとしました。そして、異なるセンサーや異なる環境からの情報を統合する、異種プリトレーニングトランスフォーマー(HPT)と呼ばれる新しいアーキテクチャを導入しました。