グーグルは再び大規模モデルの性能とコストの境界を書き換えました。本日、同社は新世代の軽量モデル「Gemini3Flash」を正式に発表しました。このモデルは前世代の3倍の応答速度を実現し、ほぼ「ゼロ遅延」に近い性能を持ち、複数の高難度ベンチマークテストで同時期のエースモデルであるGemini3Proを上回り、史上初の「小弟が大哥を倒す」Flashモデルとなりました。さらに驚くべきことに、この最高峰の性能バージョンは世界中で無料公開されており、Geminiアプリ、AI Studio、Google Antigravity、CLIツールにデフォルトで統合されています。
Gemini3Flashの画期的なパフォーマンスは「次元を下げた攻撃」とも言えます:
- コード修正の権威あるランキングSWE-benchでは、78%という得点でGemini3Pro(76.2%)をわずかに上回りました;
- 博士級の推論テストGPQA Diamondでは90.4%という高いスコアを記録しました;
- 非常困難な総合評価Humanity’s Last Exam(ツールなしモード)では33.7%の成績を収め、前世代のエースモデルGemini2.5Proを大幅に上回りました;
- LMArenaのテキスト能力ランキングで世界第3位に躍進しました。

このパフォーマンスの奇跡は、グーグルがモデル構造を深く最適化した結果です。極めて低い推論コストを維持しながら、知識蒸留や推論パス圧縮、マルチモーダル対齊などの技術を通じて、小規模モデルでも大規模モデルに近い論理的深度を備えています。ユーザーが画像や動画をアップロードすると、Flashは数秒以内にコンテンツを解析し、実行可能な計画を生成します。例えば、回路の故障を識別したり、旅行ルートを計画したりする際には、非常に迅速です。
異なるシナリオに対応するために、新バージョンのGeminiアプリには3つのインタラクティブモードが導入されました:
- 緊急モード: デフォルトでGemini3Flashを有効にしており、日常的な質問に適しています;
- 思考モード: Flashの深い推論チェーンを起動し、複雑な論理問題を処理します;
- プロフェッショナルモード: Gemini3Proを残し、高度な数学やプログラミングのタスクに専念します。
これにより、一般ユーザーは有料不要で、これまで高額サブスクリプションのみが利用可能だったスマートな体験を享受できます。Google検索で提示された複雑な質問の裏側には、最高レベルの推論能力を持つAIエンジンが動作しています。

市場データはこの戦略の成功を示しています。Geminiアプリの月間アクティブユーザーはわずか1四半期で4.5億から6.5億へと急増し、開発者数は1,300万人を超え、API呼び出し量は前年比で3倍に増加しました。Flashの追加により、Gemini3製品ラインは明確な階層を形成しました。Deep Think(深層推論)、Pro(プロフェッショナルな解決)、Flash(普及型の高速)の三段階で、大衆ユーザーから研究開発者に至るまで、全範囲のニーズをカバーしています。
無料モデルが有料エースモデルを上回るようになると、AIの競争はもうパラメータ数の比較ではなく、効率、体験、およびアクセス可能性の総合的な勝負になります。グーグルはGemini3Flashによって、次世代のAIは賢さだけでなく、速さ、節約性、そして誰もが利用できることが必要だと宣言しました。
