最近、グーグルのDeepMindは、最も強力なAIモデルであるGemini 2.5 Deep ThinkがGoogle AI Ultraサブスクリプションユーザー向けに公開されたことを発表しました。このモデルは、2025年の国際数学オリンピック(IMO)で金メダルを獲得しただけでなく、「並列思考」と強化学習技術を活用し、さまざまな分野で驚くべきパフォーマンスを示しています。
Gemini 2.5 Deep Think: AI推論能力の新たな頂点
グーグルのGemini 2.5 Deep Thinkは、Gemini 2.5シリーズで最も進んだモデルであり、複雑なタスクを処理することを目的として設計されています。その中心的な特徴は、「並列思考(Parallel Thinking)」と新しい強化学習技術の導入です。これにより、モデルは人間の頭脳風の議論プロセスを模倣し、複数の推論経路を探索して比較し、より正確で創造的な答えを生成することができます。従来のAIモデルが単一の推論経路を使用するのとは異なり、Deep Thinkのこの能力により、複雑な問題を解決する際に特に優れた性能を発揮します。
主な技術的突破:
1. 並列思考機構: Deep Thinkはマルチエージェントシステムを通じて、複数のAI「エージェント」が同時に問題を処理し、異なる仮説を検証して結果を統合できます。この方法により、推論の深さが向上し、数学、科学、プログラミングなどの複雑なタスクの対応力が大幅に向上しています。
2. 強化学習の最適化: グーグルは新しい強化学習技術を開発し、モデルが推論中に戦略を継続的に最適化することを促進しています。これにより、アルゴリズム設計や戦略計画など段階的な改善が必要なタスクにおいて、Deep Thinkはより効率的に動作します。
3. マルチモードと長文サポート: Gemini 2.5 Deep Thinkはテキスト、音声、画像、動画の入力をサポートし、100万トークンのコンテキスト窓を持ち、膨大なデータセットを処理でき、学術研究からリアルタイムアプリケーションまで幅広いシナリオに対応可能です。
IMO金メダル認証: 数学と推論の重要な節目
2025年の国際数学オリンピック(IMO)で、Gemini 2.5 Deep Thinkの特別最適化バージョンは満点42点中35点を獲得し、金メダルを獲得しました。これは、数学的推論分野におけるトップレベルの実力を示しています。IMOの会長であるGregor Dolinar教授は、「Deep Thinkの問題解決アプローチは明確で正確であり、多くの場合、人間の参加者よりも理解しやすい」と述べました。
数学・科学分野での革新:
- Deep ThinkはIMOで出題された6つの問題のうち5つを成功裏に解き、複雑な数学的問題に対する卓越した能力を証明しました。
- 去年発表されたAlphaProofおよびAlphaGeometry2モデル(銀メダルを獲得)とは異なり、Deep Thinkは純粋な自然言語処理を採用しており、特定の領域言語への依存を排除し、推論プロセスをより汎用的かつ柔軟にしています。
- オープン版のDeep Thinkは日常使用を最適化していますが、IMOベンチマークテストでは銅メダルレベルに達しており、性能と実用性のバランスを取っています。
優れたベンチマークテスト結果: コード作成と多分野知識
Gemini 2.5 Deep Thinkは、いくつかの権威あるベンチマークテストで突出した結果を収め、AI分野でのリーダーシップを強化しています:
- LiveCodeBench V6: この競争力のあるコード作成ベンチマークテストでは、Deep Thinkは87.6%のスコアを記録し、xAIのGrok4(79%)やOpenAIのo3(72%)を上回り、複雑なプログラミングタスクの処理能力を示しています。
- Humanity’s Last Exam (HLE): 数学、科学、人文科学を含む総合的なテストで、約3,000問の専門家レベルの質問を含みます。Deep Thinkは34.8%のスコアを記録し、Grok4(25.4%)やo3(20.3%)を大きく上回りました。
- WebDev ArenaとLMArena: Deep Thinkはウェブ開発と学習支援分野で突出した性能を示し、関連ランキングのリーダーとなっています。
これらの成果は、Deep Thinkが数学やコード作成だけでなく、多分野の複雑な知識問題にも対応できることが示されており、研究者や開発者にとって強力なツールを提供しています。
ユーザーへのアクセス性: AI Ultraサブスクリプションユーザー限定
Gemini 2.5 Deep Thinkは現在、Geminiモバイルアプリ(iOSおよびAndroid)を通じて、Google AI Ultraプランのサブスクリプションユーザーに公開されています。サブスクリプション料は月額249.99ドルで、新規ユーザーは最初の3か月間は124.99ドルで利用可能です。ユーザーは毎日一定数のDeep Thinkのプロンプトを使用でき、モデルは自動的にコード実行やグーグル検索などのツールを統合し、より詳細なレスポンスを生成します。
グーグルは今後数週間以内に、Gemini APIを通じて信頼できるテスト者(数学者や開発者など)に、ツール付きとツールなしのDeep Thinkバージョンを提供する予定です。これにより、企業や開発環境での応用可能性をさらに探求することができるでしょう。
業界への影響と未来展望
Gemini 2.5 Deep Thinkのリリースは、AIの推論能力のさらなる飛躍を示しています。並列思考と強化学習技術の導入により、モデルは学術的およびコード作成タスクにおけるパフォーマンスを向上させ、デザイン最適化や戦略計画などの創造的タスクにも新たな可能性を開拓しました。グーグルのDeepMindは、将来的にはIMO満点を目指し、他の分野にも拡張していく予定だと述べています。
AIbaseの見解: Gemini 2.5 Deep Thinkの登場は、AI業界が単なるパターン認識からより深い推論と創造性へと進化していることを示しています。しかし、高いサブスクリプション料金や計算リソースの要求は、その普及を制限する要因となるかもしれません。今後、グーグルがパフォーマンス、コスト、アクセス性のバランスをどう取るかが、Deep Thinkが本当にAI業界の「ゲームチェンジャー」となるかどうかを決定する鍵となります。
結論