グーグルがGemini 3を発表した後、その中のGemini 3 Proは1501 EloでLMArenaの公開ランキングで歴史的な最高点を記録し、GPT-5.1やClaude 4.5、Grok-4.1を上回り、現在最も高いスコアを持つマルチモーダルモデルとなりました。

パフォーマンス面では、Gemini 3 Proは「人類の最終試験」で37.5%、GPQA Diamondでは91.9%のスコアを獲得し、MMMU-ProおよびVideo-MMMUではそれぞれ81%と87.6%を達成しました。これは、科学、数学およびビデオ理解タスクにおいて全体的に優れていることを示しています。強化された推論モードであるDeep Thinkにより、「人類の最終試験」のスコアは41%に上昇し、ARC-AGI-2では45.1%を記録し、汎用知能評価テストの記録を更新しました。

モデルの発表後、OpenAIのCEOであるSam AltmanはXプラットフォームで「Gemini3はとても良いように見えます」と投稿し、グーグルのCEOであるSundar Pichaiは「🙏」で応えました。エロン・マスクもLMArenaの公式アカウントにコメントし、「確かに祝うに値します」と述べ、Grok 4.20が間もなくリリースされる予定であることを明らかにしました。

市場的には、Altmanは後に流出した社内メモの中で、グーグルの急速な進展がOpenAIにとって「一時的な経済的困難」をもたらす可能性があると率直に語り、従業員に今後の外部からの評価が「相当厳しい」ものになると注意を促しました。これは、Gemini3の強力なパフォーマンスがシリコンバレーのAI競争の構図をさらに激化させていることを示しています。