ゲーム動画共有プラットフォームのMedalは最近、General IntuitionというAI研究ラボを分社化し、1億3,370万ドルのシードラウンドファイナンスを完了したことを発表しました。この資金調達はKhosla VenturesとGeneral Catalystがリードし、Raineも参加しています。このスタートアップ企業は、Medalが蓄積した膨大なゲーム動画データを使って基礎モデルやAIエージェントを訓練しており、空間と時間の中で物体やエンティティがどのように移動するかを理解することに注力しています。この能力は「空間-時間推論」と呼ばれています。

General Intuitionは、MedalのデータセットがTwitchやYouTubeなどの代替プラットフォームよりもAIエージェントのトレーニングにおいて優れていると考えています。このデータセットには、月間アクティブユーザーが1,000万人で、年間20億本の動画が含まれており、数万種類のゲームがカバーされています。MedalおよびGeneral IntuitionのCEOであるPim de Witteは、「プレイヤーがアップロードする動画の一部は極端な否定的または肯定的なケースであり、これはトレーニングに非常に価値のあるエッジデータを提供します。」と説明しています。「選択バイアスによって、実際にトレーニングに使用したいデータに焦点を当てることができます。」

このデータの優位性はOpenAIにも注目されたとされています。The Informationによると、OpenAIは昨年Medalを5億ドルで買収しようとしたが、OpenAIとGeneral Intuitionともにその報道に対してコメントしていません。

技術的な進展としては、創業チームはいくつかの突破を遂げています。General Intuitionのモデルは、トレーニングされていない環境を理解し、その中の行動を正しく予測することができます。このモデルは完全に視覚入力によって実現されており、エージェントは人間のプレイヤーが見ているもののみを見ることができ、コントローラー入力を介して空間内で移動します。同社は、このような方法が機械アーム、ドローン、自動運転車などの物理システムに自然に移行できることを示しています。これらのデバイスは通常、人間がゲームコントローラーで操作するためです。

General Intuitionの次の目標には、他のエージェントのトレーニング用に新しいシミュレーション世界を生成すること、そして完全に未知の物理環境での自律的なナビゲーションがあります。

商業戦略において、General Intuitionは他の世界モデル開発者とは明確に異なります。同社もまた、エージェントのトレーニング用に世界モデルを作成していますが、それ自体が製品ではありません。DeepMindやWorld LabsがそれぞれGenieやMarbleという世界モデルを販売してエージェントのトレーニングやコンテンツ制作に利用しているのとは異なり、General Intuitionは著作権問題を避けるために別の応用シーンを選んでいます。

de Witteは明確に述べました。「我々の目的は、ゲーム開発者と競争するモデルを生み出すことではありません。」逆に、同社のゲームアプリケーションは、従来の「確定性ロボット」—すなわち常に同じ出力を生成する事前にプログラムされたキャラクター—を越えたロボットやNPC(非プレイヤーキャラクター)の作成に焦点を当てています。

General Intuitionの創設メンバーで、Lightspeed VenturesのパートナーであるMoritz Baier-Lentzは、「これらのロボットはあらゆる難易度レベルに拡張できます。すべての人を倒す無敵のロボットを作るのではなく、段階的に拡張し、あらゆるプレイヤーの状況に合わせて流動性を補完し、勝率を常に約50%に保つことができれば、彼らの参加度と保持率を最大限に引き上げることができます。」と語っています。

de Witteは人道主義的な経験を持っており、それが同社が捜索救助ドローンへの関心を高めることに影響を与えています。このようなドローンは、GPSがない状態でも不慣れな環境をナビゲートし、情報を抽出する必要があります。

長期的なビジョンにおいて、de WitteとBaier-Lentzは、General Intuitionのコア機能である「空間-時間推論」が汎用人工知能(AGI)への鍵だと考えています。主要なAI研究所がより強力な大規模言語モデルの構築に注力している中、General Intuitionは真のAGIが必要とする、大規模言語モデルでは根本的に欠如しているものを必要としていると信じています。

de Witteは、「私たちは文を書き、私たちの世界で起こっていることを記述しますが、その際には多くの情報が失われます。空間-時間推論に関する一般的な直感も失われてしまいます。」と述べました。