アルファベット傘下のグーグルは、正式にGemini3を発表しました。このモデルは、初めて100万トークンのコンテキストウィンドウを提供し、テキスト、画像、動画、コードをネイティブに扱うマルチモーダル推論をサポートしています。公式によると、Gemini3ProはGPQA Diamondの修士課程レベルのテストで91.9%の正確性を達成し、LMArenaでは1501Eloでトップとなり、GPT-5.1やClaude4.5を上回り、現在公開されているランキングで最高スコアのモデルとなっています。

Gemini3は、新たに開発されたDeep Think強化推論モードを採用しており、「思考のサイン」と「思考の段階」を通じて推論プロセスを製品化しています。ARC-AGI-2でのスコアは45.1%で、複数ステップの論理、事実の正確性、科学的な図表の理解においてSOTAを更新しました。グーグルは同時にGoogle Antigravity開発プラットフォームもリリースし、代理型コーディングとビジュアルコーディングをサポートしています。LiveCodeBench ProではElo2439、Terminal-Bench2.0での端末操作の正確性は54.2%であり、データのクロール、分析、レポート作成、配備の全工程を自主的に行うことが可能です。

Gemini3は現在、Google AI Ultraサブスクリプションユーザー向けに公開されています。今後数週間以内にGeminiアプリ、AIモード検索、および企業向けVertex AIにも順次対応する予定です。グーグルは、モデルが自社開発のTPU v6Podsで訓練され、90%の検索市場シェアと20億人の「AI概要」月間アクティブユーザーを基盤としており、AIが研究室から生産ラインへと急速に移行すると述べています。