OpenRouterが最新のモニタリングデータを公開したところ、世界中の大規模モデル呼び出し市場は「東に向かう」激しいパラダイムシフトを経験しています。先週(5月18日から5月24日)の世界中でのAI大規模モデル総呼び出し数は、28.9テラトークンに達し、前週比で7.4%増加し、5週連続の強力な成長トレンドを示しています。
この計算リソースと応用の世界的な競争において、中国のAI大規模モデルは規模面で米国を継続的にリードしており、その成長速度は驚くべき爆発力を示しています。
主要データの洞察:
世界全体の規模: 世界の週間呼び出し量は28.9テラトークンに達し、5週連続で上昇しており、AIインフラストラクチャーは高頻度で常態化された呼び出し段階に入っています。
中国のリード: 中国のAI大規模モデルの週間呼び出し量は9.223テラトークン
米国の追従: 米国のAI大規模モデルの週間呼び出し量は4.93テラトークン
リードの状況:中国の大規模モデルは4週連続で米国を上回る週間呼び出し量を記録しています。また、リードの差はさらに広がっています。
「追従」から「主導」へ:中国AI呼び出しの三つの論理
中国のAI呼び出し量が米国を逆転し、4週連続で世界一を維持できたのは、単なる量の蓄積ではなく、質の飛躍にも起因しています:
1. 高コストパフォーマンスな「産業級」APIエコシステム
米国のモデルはAPIの価格が高い一方、中国のモデル(例えばZhipu GLMシリーズ、DeepSeek、Qwenなど)はエンジニアレベルの性能を保ちながら、非常に競争力のある価格戦略を提供しています。このような「高知能+低遅延+高コストパフォーマンス」の組み合わせにより、特に新興市場の開発者たちの心を迅速に獲得しています。
2. 開発者エコシステムとの深層的な融合
OpenRouterのデータによると、中国のAIモデルは世界の開発者のワークフローにさらに深く埋め込まれています。AIエージェント開発、自動プログラミング、または大規模なコンテンツ生成など、中国モデルの推論環境の互換性が改善され、海外の開発者は複雑なアプリケーションを開発する際、中国モデルをモデルルーティング(Model Routing)の中心的な呼び出しチェーンに含めることが増えています。
3. 応用側の「次元の低下攻撃」
5月に発表された一連のAI製品を見てみると、バイトダンスのLance 3BネイティブマルチモーダルモデルやZhipu GLM-5.1の400トークン/秒の高速APIなど、中国のAI産業の物語の論理は「単純な順位付け」から「実戦的なコスト削減」へと移行しています。こうした現実的なビジネス課題を解決できるモデルは、当然ながら呼び出し量において高い粘着性を示します。
業界予測:AIインフラストラクチャーの「多極化」時代到来
中国が呼び出し量で世界一を占めているものの、業界アナリストはこれが単なる「勝敗の問題」ではなく、グローバルAIインフラストラクチャーの多極化の必然的な結果であると指摘しています:
米中モデル二元制: グローバルな開発者が調用チェーンで同時に米中モデルを使用することに慣れてきています。異なるタスク負荷に対応して、最もコスト効率の良いAPIを選択することは、開発者の基本的な操作となっています。
計算力とデータの二重循環: 呼び出し量は数字だけでなく、訓練データとフィードバックループの出所でもあります。中国モデルの呼び出し量が継続的にリードしていることは、中国AIがより多様でグローバルな語彙フィードバックを得ていることを意味し、それによって中国モデルのイテレーションサイクルが加速し、「呼び出し増加→パフォーマンス最適化→再び呼び出し増加」というポジティブな増幅のループを形成しています。
