記事では、42歳のボノボ、カンジが「マインクラフト」をプレイする実験に成功したチンパンジー行動計画について報じています。その学習方法は、GPT-4エージェントの訓練方法と似ていることが分かりました。コンテキスト強化学習、RLHF、模倣学習、カリキュラム学習などの手法を用いて、カンジは移動、報酬の収集、障害物の破壊などのスキルを習得しました。この実験は、動物が新しい環境を認識し適応する能力が、AIエージェントを凌駕することを示しています。
ゴリラがマインクラフトをプレイ!?GPT-4インテリジェントエージェントと共通の手法とは?
