最近、研究者らはDIAMOND(Diffusion for World Modelling)と呼ばれるAIモデルを開発しました。これは、有名なPCゲーム「カウンターストライク:グローバルオフェンシブ」(CS:GO)をニューラルネットワーク内でシミュレートできるモデルです。

このモデルはNvidia RTX3090グラフィックボード上で動作し、毎秒10フレームの速度を実現しています。フレームレートは高くありませんが、AIシミュレーションの分野においては注目すべき成果です。

image.png

DIAMONDのトレーニングデータはわずか87時間のCS:GOゲーム記録であり、GameNGenなどの類似プロジェクトに必要なデータのわずか0.5%に過ぎません。データ量が少なくても、このモデルはゲーム内の印象的なシーンをシミュレートできます。

DIAMONDは当初、Atariゲームでその能力が示されました。Transformerベースのアプローチを採用し、プレイヤーの移動を「トークン」として扱います。これは、文章における単語のようなものです。これらのトークンを予測することで、モデルは過去の行動に基づいてプレイヤーの次の行動を予測する方法を学習します。

image.png

研究者のEloi Alonso氏はTwitterでこのモデルの能力を公開しました。ビデオでは、プレイヤーがキーボードとマウスを使ってシミュレートされたCS:GO環境とインタラクトしている様子を見ることができます。シミュレーションには、プレイヤー間のインタラクション、武器のメカニズム、環境の物理効果など、複雑な要素が含まれています。しかし、DIAMONDにはまだいくつかの明らかな欠点があります。

例えば、モデルはSourceエンジンの重力や衝突判定を考慮していないため、プレイヤーは無限にジャンプできます。また、プレイヤーがトレーニングデータで一般的に使用されている経路から外れると、シミュレーションは完全に崩壊します。

研究者らは、データ量と計算能力の向上により、モデルの性能がさらに向上すると考えています。また、将来的には、複雑な現実環境をナビゲートできるAIモデルの開発も可能になると考えています。

なお、DIAMONDのCS:GOシミュレーションは、Google Research、Google DeepMind、テルアビブ大学が共同で開発したGameNGenシステムに触発されています。このシステムは、単一のGoogle TPUチップ上で毎秒20フレームの速度で、古典的なゲームDOOMの一部を完全にシミュレートできます。

AIに興味のある開発者の皆様は、DIAMONDモデルはGitHubでオープンソース化されていますので、ぜひご活用ください。

プロジェクト入口:https://diamond-wm.github.io/

要点:

- 🎮 研究者らが開発したAIモデルDIAMONDはCS:GOをシミュレートでき、Nvidia RTX3090上で動作し、毎秒10フレームの速度を実現しています。

- 📊 このモデルはわずか87時間のゲームデータを使用してトレーニングされましたが、データ量が少なくても複雑なゲームシーンをシミュレートできます。

- 🐛 DIAMONDにはいくつかの深刻な制限とバグがありますが、研究者らはデータと計算能力を増やすことで、将来的にモデルの性能を向上できると考えています。