GitHubで現在削除されているブログ記事が偶然にOpenAIの次世代主力モデルGPT-5の重要な情報を漏洩させた。このドキュメントはRedditユーザーによって最初に発見され、その後The Vergeが報じたものであり、外部の人々にとってGPT-5の機能特性を初めて公式に垣間見る機会となった。

4つのバージョンですべてのシナリオに対応

漏洩したドキュメントによると、GPT-5は4つの特化したバージョンを提供する予定である:GPT-5は論理的思考や複数ステップのタスクに特化している;GPT-5-miniはコストに敏感なシナリオに対して軽量なソリューションを提供する;GPT-5-Nanoは速度と低遅延アプリケーションを主に扱う;GPT-5-Chatは企業環境向けに設計されており、高度なマルチモーダルおよび文脈感知型対話サポートを備えている。

GitHubではGPT-5をOpenAI「最高のモデル」と位置付け、推論、コード生成、全体的なユーザーエクスペリエンスにおいて顕著な進歩を強調している。新しいモデルは「最小限の指示で複雑なコード作成タスクを完了できる」とし、「拡張されたエージェント能力」を導入し、より自律的なスマートアシスタントとして動作可能にしている。

大幅な改善はあるが限界も明確

しかし、The Informationの最近の報告によると、GPT-5の実際の性能には冷水を浴びせられた。内部テストでは、数学、コード作成、指示実行に関して確かに改善していることが確認されたが、そのパフォーマンス向上の幅は、GPT-3からGPT-4への移行時にユーザーが体験した飛躍的な進化よりもはるかに小さい。

OpenAIが以前に公開したGPT-5の候補バージョン――コードネーム「Orion」の大規模言語モデル――は期待に応えられず、GPT-4.5としてリリースされ、わずかな改善しかなく、運用コストも高かったため、すぐに姿を消した。また、o1やo3などの「推論モデル」は特定の分野では優れた性能を発揮するが、日常的なチャットでの使用では明らかに欠点が見られる。o3-proでは、単純な挨拶生成のために過剰な計算リソースを消費してしまうこともある。

バランスが鍵となる

初期モデルの制約に直面して、OpenAIはGPT-5を通じて高度な推論と信頼性のある日常的なコミュニケーションの間に更好的なバランスを見出そうとしている。情報によると、新モデルにはタスクの複雑さに応じて計算リソースを動的に割り当てることができる仕組みが含まれており、前のモデルの「過度な考え込み」問題を回避できる可能性がある。

漏洩したドキュメントはすでに削除されているが、その情報から明らかになったのは、GPT-5が革命的な突破ではなく、段階的なアップグレードであるということだ。ユーザーが大きな向上を感じられるかどうかは、正式リリース後の実際のパフォーマンスにかかっている。