グーグルのCEOであるサンドラ・ピチャイ氏は、最近のグーグルクラウドイベントで、グーグルのAI製品とインターフェースが月に処理するトークン数が1.3兆を突破したことを発表しました。この数字は6月に発表した9800億トークンのマイルストーンを更新し、それ以来約3200億増加しています。
トークン急増の真実:計算複雑度の指標
1.3兆のトークンという数字は、ユーザーの利用量が大幅に増加しているように聞こえるかもしれませんが、実際にはAIモデルのバックエンドにおける計算複雑度の急速な上昇を示しており、ユーザーの実際の利用や実用価値の直接的な指標ではありません。
分析によると、トークン消費の急増は、Gemini 2.5 Flashなどの新しい推論モデルの導入によって引き起こされた可能性があります。これらのモデルは、それぞれのリクエストでより多くの内部計算を行います。例えば、ある分析では、Gemini Flash 2.5が1回のリクエストで使用するトークン数が前バージョンよりも約17倍多く、推論タスクのコストが150倍になることが示されています。また、動画、画像、音声処理などの複雑なマルチモーダル機能も総トークン数に含まれている可能性があります。
したがって、この数字は、グーグルのバックエンドの計算負荷やインフラストラクチャの拡張を測る指標であり、ユーザー活動や実際の効果を直接測る指標とは見なされていません。

環境声明への疑問:計算規模と報告との不一致
グーグルが公表した大きなトークン消費量は、外部からの環境影響報告に対する批判を強化しています。
グーグルが以前に発表した環境報告書では、典型的なGeminiテキストプロンプトは0.24ワット時、0.03グラムの二酸化炭素、0.26ミリリットルの水を消費すると記載されており、9秒のテレビ放送時間よりも少ないと言っています。しかし、批判者はこれらのデータが最小限の計算単位を測定したものであり、リソース消費が少ない軽量言語モデルに基づいている可能性があると考えています。
