量子化プラットフォーム nof1.ai が主催する Alpha Arena1.5シーズンの成績が発表されました。xAI 内部コード名 Grok4.20 の実験モデルは +12.11% の収益率で優勝し、1万ドルの初期資金を14取引日で12,193ドルに増やしました。これは唯一の大型言語モデルによる正の収益を達成したものです。一方、GPT-51とGemini3.0はそれぞれ3.4%と5.7%の損失を記録しました。
4つの「地獄モード」においても人間の介入なし
大会のルールでは、いかなる人間の調整も禁止されています。モデルは「苦行僧モード(高レバレッジ制限)」と「状況認識モード(対戦者のポジションを見ることができる)」の間で自動的に切り替える必要があります。Grok4.20は状況認識ラウンドで、Palantir(PLTR)に対して10倍レバレッジのポジションを2時間早く構築し、その日の個人投資家の感情指数が38%上昇し、終値で11.4%の利益を得ました。この行動は主催者によって「教科書的な感情アービトラージ」と称されました。
リアルタイムのXデータフローが決定的な要因
主催者は、Grok4.20がミリ秒単位でX(Twitter)のFirehoseにアクセスできることを明らかにしました。このモデルは1日あたり6,800万件の英語ツイートを処理し、内蔵された感情-価格モデルにより1〜5分の超短期シグナルを生成します。それに対し、GPT-51は15分遅延のニュースサマリーのみを使用でき、Gemini3.0は財務報告書とSECファイルに依存しており、情報のタイミングが30分以上遅れています。
マスク氏が直接「いいね」、Grok5が目前に
xAI創業者のマスク氏は試合後に投稿しました。「Grok knows the vibes.4.20→5.0🚀」というコメントを残し、次世代のGrok5がリアルタイムの感情エンジンを「市場・SNS・マクロ」の3次元フレームワークにアップグレードすることを示唆しています。市場の噂によると、xAIは2025年第1四半期に機関向けの「Grok Trader API」をリリースする予定で、年間費用は50万ドルに上る見込みです。現在、20以上のヘッジファンドから意欲的な注文が寄せられています。
ウォールストリートからの警鐘
nof1.aiのCEOは、この大会は「LLMが直接注文を行う可能性を探索するためのものである」と述べました。結果は、感情データと強化学習の組み合わせが過剰収益を生むことを示しており、「モデルが2時間以内に個人投資家のMemeを理解できるようになれば、従来の定量ファンドのハイパフォーマンスの優位性は低下するだろう」と述べました。しかし、彼はまた、単一の期間での勝利が戦略の安定性を意味しないことを指摘し、今後の大会ではT+0の両方向取引、オプションおよび暗号資産を取り入れて、モデルの適応性をさらに検証する予定であると語りました。
業界のシグナル:AIトレーディングは「リアルタイム感情」の段階へ
