関係筋によると、世界のAI分野をリードする企業であるOpenAIは、最近、英偉達以外の計算能力の代替案を体系的に探求している。この動きは、英偉達が最新のAIチップが特定の推論プロセス(特に応答速度)において期待に添わないことを懸念したためである。
核心的な課題:推論速度がユーザー体験を制限
OpenAIはコード生成や複雑なソフトウェアシステムとの対話シナリオにおいて、現在のハードウェアの応答速度がボトルネックになっていると発見した。
戦略のシフト:OpenAIは、モデル「トレーニング」から「推論(エンドユーザーに答えを出力するプロセス)」への注力を強めている。
遅延とスループット:推論段階のパフォーマンスはユーザー体験と運用コストに直結している。高帯域幅・低遅延の特定タスクでは、従来のGPU構造が外部メモリに頻繁にアクセスするために遅延が生じ、チップが長時間「データ待ち」の状態になる。
専門ユーザーの高い要望:CEOのサム・アルトマン氏は、開発者などの専門ユーザーがコード系モデルの生成速度に対して非常に敏感であり、現在のハードウェア構造が製品体験を制限していると述べた。
代替案:推論加速の新興勢力と提携
ハードウェアのボトルネックを解決するため、OpenAIは今後約10%の推論計算能力を担う新しいハードウェアを導入する計画だ。
Cerebrasの導入:OpenAIはCerebrasと提携を結んだ。同社の構造は一枚のチップに大量の静的ストレージ(SRAM)を統合しており、アクセス経路を大幅に短縮し、応答速度を向上させることができる。
Groqとの交渉:会社は以前からGroqと接触しており、その推論加速の特長を利用してチャットボットなどのAIシステムを最適化しようとしていた。
巨頭同士の対立:もともと決まっていた投資が変更に
この技術的な方針転換により、OpenAIと長期的な主要サプライヤーであるNVIDIAとの関係が微妙になった。
千億ドル規模の取引停止:両社は1000億ドル規模の投資と供給契約(NVIDIAがチップで株式を交換)を交渉していたが、この交渉は数か月間停滞している。
調達の多様化:OpenAIはAMDなど他のメーカーと新たなGPU調達または協力契約を締結しており、単一サプライヤーへの依存をさらに分散させている。
競争圧力:一方で、AnthropicのClaudeやグーグルのGeminiは主にグーグル独自開発のTPUに依存しており、推論タスクにおける天然の優位性がNVIDIAに大きなプレッシャーを与えている。
両社は公式には積極的な協力姿勢を維持しているが、NVIDIAのCEOである黄仁勲氏も不和の噂を否定している。しかし、OpenAIが実際に第三者の推論チップを購入し始めたことにより、AI計算力市場の「一つの超大国と多数の強国」という構図が再編され始めている。
