image.png

AIBase | 2025年8月8日報道

2025年8月7日、OpenAIは最新の人工知能モデルであるGPT-5を正式に発表しました。このリリースは生成型AI分野における新たな出来事です。OpenAIがこれまでに開発した中で最も強力で知的なモデルであるGPT-5は、技術的な能力において大きな進歩を遂げただけでなく、多段階の価格とアクセス戦略を通じてAIの普及をさらに推進しています。本記事では、GPT-5のモデル特徴、価格構造、バージョンの違い、評価スコア、ユーザーの使用ハードル、モデルの能力および業界での意見について詳しく解説します。

一、GPT-5モデル概観

GPT-5はOpenAIの最新の先端モデルであり、高度な推論能力、マルチモーダル処理およびタスク実行能力を統合し、ユーザーによりスマートで効率的なAI体験を提供することを目的としています。以前のモデルと比較して、GPT-5は統一されたシステムアーキテクチャにより、迅速な応答用の軽量モデルと深層推論モデル(例:GPT-5Thinking)を自動的に選択し、タスクの複雑さやユーザーのニーズに応じて適切な処理方法を選択するように設計されています。OpenAIのCEOであるSam Altmanはこれを「世界で最高のモデル」と称し、「汎用人工知能(AGI)への重要な一歩」と述べました。ただし、彼はGPT-5が継続的な学習能力を欠いていることを指摘し、これはAGIの重要な特性の一つであると考えられています。

主な特徴:

  1. 統一されたシステムアーキテクチャ: GPT-5はリアルタイムルーターによって、タスクの種類、複雑さ、ユーザーの意図に基づき、迅速な応答モデルまたは深層推論モデル(例:GPT-5Thinking)を動的に選択し、ユーザー操作を簡素化し、手動でモデルを選択する必要性を排除しています。
  2. マルチモーダル対応: テキストと画像処理をサポートし、今後は動画や音声処理への拡張も計画されており、さまざまなシナリオでの応用能力をさらに強化しています。
  3. 幻覚の低減: 前世代のモデルと比較して、GPT-5は誤った情報(幻覚)の生成を大幅に減少させ、GPT-4oよりも26%低い幻覚率を達成しています。
  4. セキュリティの向上: 「セーフコンプリーション(安全な完了)」メカニズムにより、潜在的なリスクがある問題の処理時に高レベルの応答を提供し、有害なコンテンツの生成を回避しています。OpenAIは開発中に5000時間以上のセキュリティテストを実施し、モデルの堅牢性と信頼性を確保しました。

二、価格とバージョンの違い

GPT-5はさまざまなバージョンと価格戦略を提供し、異なるユーザー層のニーズに対応しています。以下に主要なバージョンとその価格構造の詳細を示します。

1. ユーザー側の料金(ChatGPTプラットフォーム)

  • 無料層(Free Tier): ChatGPTの無料ユーザーはすべてGPT-5を使用できます。これはOpenAIが初めて推論能力モデルを一般公開したものです。しかし、無料ユーザーには非公開のプロンプト回数制限があり、上限に達するとより軽量だが高性能なGPT-5Miniに切り替わります。
  • Plus層($20/月): PlusユーザーはGPT-5の使用配額が高く、日常的なタスク処理に適しており、無料層よりもパフォーマンスが優れています。
  • Pro層($200/月): ProユーザーはGPT-5の無制限アクセス権を持ち、強化版のGPT-5Proを使用でき、追加の計算リソースにより正確な回答を提供します。これは高強度・専門的なタスクに適しています。
  • チーム、企業、教育向けユーザー(Team、Enterprise、Edu): これらのユーザーはリリース後1週間以内にGPT-5をデフォルトモデルとして利用でき、配額が緩やかで組織レベルのアプリケーションに適しています。

2. 開発者APIの料金

GPT-5はOpenAIのAPIを通じて3つのバージョンを提供し、コストとパフォーマンスのニーズに応じて調整されます。

  • GPT-5: 100万トークンあたりの入力は$1.25、出力は$10です。
  • GPT-5Mini: 100万トークンあたりの入力は$0.25、出力は$2で、高コスト効果の場面に適しています。
  • GPT-5Nano: 100万トークンあたりの入力は$0.05、出力は$0.40で、APIのみに限定され、GoogleのGemini2.5FlashやFlash-Liteと競争力があります。
  • GPT-5Chat: Pro層ユーザー向けに設計され、ChatGPT内の会話ニーズに自動的に適合します。

また、開発者は新しい「verbosity」パラメータを使用して、モデルの応答長を制御し、コストと出力効率を最適化できます。

3. バージョンの違い

  • GPT-5: コアモデルで、速度とパフォーマンスのバランスが取れており、大多数の複雑なタスクに適しています。
  • GPT-5Mini: 軽量バージョンで、高速かつコストが低く、チャットボットやモバイル音声アシスタントなどの高トラフィックアプリケーションに適しています。
  • GPT-5Nano: 超軽量バージョンで、APIのみに限定され、低コスト・低遅延のシーンに最適化されています。
  • GPT-5Pro: 強化版で、Proユーザーのみが利用可能で、より強力な推論能力和高品質な出力を提供し、プロフェッショナルな開発や企業向けアプリケーションに適しています。
  • GPT-5Thinking: 複雑なタスクに特化した深層推論モデルで、応答時間が長くても精度が高いです。Proユーザーは設定で選択可能です。

三、評価スコアとパフォーマンス

GPT-5はいくつかの基準テストで優れたパフォーマンスを示し、特にプログラミング、数学、健康関連のタスクにおいて顕著です。以下の重要な評価テストでの結果を示します:

  • SWE-bench Verified(プログラミングタスク): GPT-5は74.9%のスコアを記録し、AnthropicのClaude Opus4.1(74.5%)とGoogle DeepMindのGemini2.5Pro(59.6%)を上回りました。前のモデルo3と比較して、GPT-5は効率性が大きく向上し、出力トークンは22%減少し、ツール呼び出しは45%減少しました。
  • Aider Polyglot(コード編集): GPT-5は88%の記録を達成し、o3との比較でエラー率が1/3低下し、ソフトウェアエンジニアリングタスクにおける強さを示しました。
  • AIME2025(数学): ウェブツールを使用せずに、GPT-5は94.6%のスコアを取得し、数学分野において新しい基準を設けました。
  • GPQA Diamond(博士級科学問題): GPT-5Proは89.4%のスコアを記録し、Claude Opus4.1(80.9%)とxAIのGrok4Heavy(88.9%)を上回りました。
  • Humanity's Last Exam(総合試験): GPT-5Proはツールを使用して42%のスコアを記録し、xAIのGrok4Heavy(44.4%)にわずかに劣りました。
  • HealthBench Hard(健康関連): GPT-5は46.2%のスコアを記録し、健康問題の回答においてより正確で信頼性がありました。

しかし、GPT-5は特定の分野では競合他社を完全に超えていません。例えば、ARC-AGIテストではGPT-5の結果が予想外であったため、一部の抽象的推論タスクでの限界が示されました。また、知識の終了日は2024年であり、最新情報の処理能力に制限があります。

四、ユーザーの利用ハードル

GPT-5のリリースは、OpenAIがAIの普及化への取り組みを示すものであり、多段階のアクセス戦略を通じて利用ハードルを下げています:

  • 無料ユーザー: ChatGPTを通じて無料でGPT-5にアクセスでき、無料層ユーザーは推論モデルの体験を初めて得ますが、使用配額の制限があります。完全な機能は数日かけて徐々に開放される可能性があります。
  • 有料ユーザー: PlusおよびProユーザーはサブスクリプションを通じてより高い配額や無制限アクセス権を得られます。ProユーザーはGPT-5ProやGPT-5Thinkingなどの高級モデルも利用できます。
  • 開発者: OpenAIのAPIプラットフォーム(platform.openai.com)やPython SDKを通じて、開発者はGPT-5シリーズモデルを簡単に統合できます。APIは複数のバージョンをサポートし、予算とパフォーマンスのニーズに応じた選択が可能です。
  • 企業および教育向けユーザー: Microsoft Azure AI FoundryやOpenAIのTeam/Edu/Enterpriseプランを通じて、組織ユーザーはカスタマイズされたアクセス権を得られます。大規模な展開に適しています。

また、GPT-5はカスタマイズ設定をサポートしており、4つのプレセット人格(Cynic、Robot、Listener、Nerd)とチャットカラーを選択できるため、ユーザー体験をさらに向上させています。

五、モデルの能力

GPT-5は複数の分野で顕著なパフォーマンス向上を示し、特に以下のような点で強みを見せています:

  1. プログラミングとソフトウェア工学:

    • GPT-5は「世界で最高のプログラミングモデル」として称賛され、複雑なコードベースの処理、フロントエンドUIの生成、コードのデバッグ、エンドツーエンドのタスクをこなすことができます。
    • 例えば、OpenAIはGPT-5が「Jumping Ball Runner」という単ページゲームアプリケーションを開発した例を紹介しました。カラーフルUI、パララックススクロール背景、キャラクターのアニメーションを備え、複雑なアプリケーションの迅速な生成の可能性を示しています。
    • 開発者のフィードバックによると、GPT-5は古くなったコードベースやリアルタイムタスクの実行においてClaude Sonnet4より優れているとされています。
  2. 推論と複雑なタスク:

    • GPT-5は「思考」メカニズム(チェーン・オブ・シンス)を通じて数学、科学、論理タスクで優れた性能を発揮し、多段階の推論が必要なシナリオに適しています。
    • 例えば、法律文書の要約やローンアドバイザーのタスクを処理する際、GPT-5は具体的な指示に応じて正確な結果を提供できます。
  3. マルチモーダル処理:

    • テキストと画像の入力をサポートし、今後は動画や音声の処理にも拡張される予定で、教育、カスタマーサービス、コンテンツ制作など、より広範なシナリオに適用されます。
    • 健康分野では、複雑な健康関連の質問に正確に答えられることから、信頼性が高まっています。
  4. ツールの使用と統合:

    • GPT-5は並列ツール呼び出しをサポートし、Web検索、RAG、SQLクエリなどのツールをスマートに選択・統合し、タスクの実行効率を著しく向上させます。
    • Microsoftエコシステムと深い統合が可能で、Microsoft365Copilot、GitHub Copilotなどのプラットフォームをサポートしています。
  5. ライティングとコンテンツ生成:

    • GPT-5はライティングにおいて優れた性能を発揮し、文学的な深さとリズム感のあるテキストを生成できるため、物語、スピーチ、専門的なレポートの作成に適しています。ただし、一部のテスト者からはGPT-4.5よりやや劣るライティング能力だと指摘されています。

六、業界の意見

業界はGPT-5のリリースに対して熱烈な反応を示し、意見も多様です:

  • 肯定的な評価:

    • OpenAIのCEOであるSam Altmanは、GPT-5を「博士級の専門家」と称し、プログラミング、ライティング、健康分野で最も優れた性能を発揮していると述べ、OpenAIが業界のリーダーに戻ったことを示しています。
    • Box社のCEOであるAaron Levieは、GPT-5が複雑なドキュメントと論理推論タスクの処理で「画期的な進展」を達成したと述べ、特に企業向けデータ抽出タスクでの強さを強調しています。
    • マイクロソフトはGPT-5の統合に高い評価を示し、その推論能力と効率性がMicrosoft365CopilotやGitHub Copilotのユーザー体験を大幅に向上させるだろうと述べています。
  • 批判と疑問:

    • 一部の観察者は、GPT-5がGPT-4からの進歩がGPT-3からGPT-4への飛躍ほど大きくなく、期待されている「量子的飛躍」に満たしていないと指摘しています。