今朝のライブ配信イベントで、OpenAIは注目を集めるGPT-5モデルを正式に発表しました。このモデルは、同社がこれまでに開発した中でも最も優れたものであり、プログラミング、数学、ライティング、健康、視覚認識などの分野で最高水準の性能を示しています。

OpenAIがGPT-5モデルを正式発表:全ユーザー向けに公開 人間の専門家のように

OpenAIのCEOであるサム・オルトマン氏は、発表会でGPT-5は同社のこれまでのAIモデルにおける大きな進化であると語りました。このモデルと対話することは、各分野の専門家と話すような感覚になります。

現在、GPT-5は木曜日から無料ユーザーおよび有料ユーザーに向けて段階的に提供される予定です。有料ユーザーはより高い使用制限が適用され、Proサブスクリプションのユーザーは無制限にアクセスでき、GPT-5 Proの強力な機能を体験できます。Plusユーザーは、日常的な質問用のデフォルトモデルとして設定でき、無料ユーザーよりも大幅に多くの使用量が可能です。

OpenAIがGPT-5モデルを正式発表:全ユーザー向けに公開 人間の専門家のように

OpenAIがGPT-5モデルを正式発表:全ユーザー向けに公開 人間の専門家のように

GPT-5は、知能で効率的なモデル、深層推論モデル(GPT-5thinking)およびリアルタイムルーターの3つの主要部品から構成されています。知能で効率的なモデルは大多数の質問に答える担当で、深層推論モデルは複雑な問題に特化しています。リアルタイムルーターは、対話の種類や複雑さなどに基づいて最適なモデルを選択し、実際の信号をもとに継続的に訓練して改善します。使用制限に達した場合、これらのモデルの簡略版が残りの質問を処理する予定で、将来的にはこれらすべての機能を単一のモデルに統合する計画です。

ベンチマークテストでは、GPT-5はこれまでのすべてのモデルを上回るパフォーマンスを示しました。質問への回答速度が速く、実用性があり、幻覚現象を大幅に減らし、指示の遵守能力を向上させ、最も少ないお世辞の回答を実現しました。特にChatGPTでよく使われるライティング、プログラミング、健康相談などのアプリケーションにおいて、GPT-5の性能向上は顕著です。

OpenAIがGPT-5モデルを正式発表:全ユーザー向けに公開 人間の専門家のように

OpenAIがGPT-5モデルを正式発表:全ユーザー向けに公開 人間の専門家のように

プログラミング分野において、GPT-5はこれまでで最も強力なプログラミングモデルと評価されており、複雑なフロントエンド生成や大規模なコードベースのデバッグにおいて顕著な進歩を遂げました。これは、1つのプロンプトから美しいかつ反応が早いウェブサイト、アプリケーション、ゲームなどを作成できるようにしています。創造的表現やライティングにおいて、GPT-5は概略的なアイデアを文学的深みとリズム感を持つ作品に変換でき、構造が曖昧なライティングタスクにもより良く対応し、日常的なライティングにおいて多くの助けになります。健康分野では、GPT-5は健康に関連する質問において最も良い結果を示しており、HealthBenchスコアが以前のモデルを大きく上回っています。さらに、潜在的な問題を積極的に特定し、質問することで、より役立つ答えを提供できます。また、ユーザーの背景、知識レベル、場所に基づき、より正確で信頼性の高い応答が可能です。ただし、OpenAIは明確にこのモデルが医療専門家に代わることはできないと述べています。

また、GPT-5は数学(AIME2025でのツールなしスコア94.6%)、現実世界のプログラミング(SWE-bench Verifiedスコア74.9%、Aider Polyglotスコア88%)、マルチモーダル理解(MMMUスコア84.2%)、および健康(HealthBench Hardスコア46.2%)の分野でも新たな最先端のレベルを達成しました。

注目すべき点は、GPT-5 Proが拡張された推論能力により、GPQAテストでも新たな最先端のレベルを達成し、ツールなしでのスコアは88.4%に達しました。OpenAIが最も困難で複雑なタスクに対応するためのモデルとして登場したGPT-5 Proは、以前のOpenAI o3-Proを置き換えるものです。長時間の思考時間を確保し、スケーラブルだが効率的な並列テストを使用して計算し、最高品質で最も包括的な答えを提供します。

さまざまな困難な知的ベンチマークテストで、GPT-5 Proは優れた性能を示しています。1000を超える経済的価値のある現実世界の推論プロンプトで評価された外部の専門家は、67.8%のケースでGPT-5 Proを好む傾向があります。主な誤りは22%減少し、健康、科学、数学、プログラミングの分野で卓越した実力を示しています。