北京時間の今日は午前1時、OpenAI社は正式にGPT-5モデルを発表しました。OpenAICEOのサム・オルトマン氏は記者会見で、「これは汎用人工知能(AGI)への重要な一歩であり、GPT-5と対話することは、人間の専門家と会話するように自然でスムーズです」と述べました。

記者会見では、OpenAIチームがGPT-5モデルについて詳しく紹介しました。このモデルはSwe Benchなどの複数のベンチマークテストで優れた成績を収め、新しい基準を設定しました。主な改善点は信頼性の向上と事実の正確な説明です。

リリース計画によると、OpenAIは今日から無料、Plus、Proサブスクリプションユーザーに対してGPT-5を提供しています。無料ユーザーは無料で利用できますが、使用量には制限があります。PlusおよびProサブスクリプションユーザーは、より高い利用権を得られます。

ライブデモセッションでは、GPT-5の驚異的な能力が示されました。ベルヌーイ効果を説明するよう求められると迅速に応答し、視覚効果を作成する際も、応答時間がやや長かったものの、問題なくタスクを完了しました。ユーザーはGPT-5に「深く考える」または「より正確に」など、実際のプロンプト内で指示することもでき、その思考プロセスを見ることも可能です。プログラミングデモでは、GPT-5は数分で200行以上のコードを出力し、フランス語を学ぶパートナー向けのウェブサイトを作成しました。

プログラミング能力だけでなく、GPT-5は音声モードも近日中にリリースされる予定です。ライブ配信では、ChatGPTが音声モードで単語一つで返答し、「誇りと偏見が『人間関係』である」という素晴らしいまとめをした様子が紹介されました。

wechat_2025-08-08_061107_594.png

ChatGPTのメモリ(Memory)機能もアップグレードされ、Pro、Plus、TeamsサブスクリプションユーザーはChatGPTをGoogleアカウントに接続してカレンダーの内容にアクセスし、GmailやGoogleカレンダーと連携できます。これにより、GPT-5はユーザーの日常スケジュールに基づいてより多くの文脈情報を取得し、メールの返信を思い出させるなどの機能が可能になります。この機能は来週からProユーザーにまず提供され、その後、PlusおよびTeamsサブスクリプションユーザーへ拡大されます。

セキュリティと詐欺防止に関しては、OpenAIも力を入れています。GPT-5の目標は、セキュリティ制限の中でユーザーを最大限にサポートすることです。以前のモデルのように安全を理由に直接回答を拒否するのではなく、GPT-5はなぜ助けられないのかを説明し、ユーザーに第三者またはマニュアルにアクセスするように導きます。

wechat_2025-08-08_061217_435.png

GPT-5シリーズはGPT-5、GPT-5mini、GPT-5nanoの3つのモデルで構成されており、すべてのモデルで文脈長は400K、最大出力は128Kトークンです。API価格では、GPT-5の100万トークン入力は1.25ドル、出力は10ドル。GPT-5miniの100万トークン入力は0.25ドル、出力は2ドル。GPT-5nanoの100万トークン入力は0.05ドル、出力は0.40ドルです。

wechat_2025-08-08_061241_819.png

注目すべきは、GPT-5が初めて「内蔵型三位一体統合アーキテクチャ」を採用したことです。これはGPT-5-main、GPT-5-thinking、リアルタイムルーティング機構から構成され、残額がなくなると自動的に切り替わるミニバージョンが付属しています。リアルタイムルーティング機構は「交通指揮官」のような役割を果たし、会話の状況、複雑さ、ツールの要件、ユーザーの意図に基づき、ミリ秒単位で最適なモデルをスケジューリングし、実際のユーザーからのフィードバックを通じて継続的に進化します。無料版のChatGPTでもGPT-5を体験できますが、使用量には上限があり、超過するとGPT-5-miniに降格されます。Plus、Pro、チーム、企業、教育ユーザーはサブスクリプションレベルに応じてより高い使用量または無制限の利用権を得られます。Proユーザーは独自のGPT-5Proモードを独占利用できます。

さまざまなベンチマークテストにおいて、GPT-5は非常に優れた成績を収めています。2025年の米国AIME数学コンペティションでは、ツールなしのバージョンで94.6%の得点を記録し、Pythonを活用すると99.6%まで上昇し、ProバージョンでPythonツールを追加することで満点を達成しました。ソフトウェアエンジニアリングの権威的なSWE-benchテストでは、GPT-5-thinkingが74.9%で記録を更新し、o3の69.1%を大幅に上回りました。健康分野のHealthBench Hardサブセットでは、GPT-5-thinkingがo3の31.6%から46.2%へと急上昇し、世界第1位を獲得しました。セキュリティの観点からは、高リスクシーンの誤り率がGPT-4oよりも50倍低下し、潜在的な幻覚率がo3よりも8倍低下し、世界中の健康シーンでゼロエラーを達成しました。ただし、ライブ配信中には少しだけ小規模なトラブルが発生し、公式プレゼンテーションのPPTでo3がSWE-benchでの棒グラフが4oと同じ高さに描かれていたことがあり、コメント欄でユーザーから笑いを誘いました。

wechat_2025-08-08_061127_258.png

wechat_2025-08-08_061155_355.png

OpenAIは、GPT-5のトレーニングデータが依然として公開ネットワーク、協力者の許諾、ユーザー生成コンテンツから来ていることを強調していますが、改良されたフィルタリング戦略とModeration APIによってプライバシーや有害情報のリスクを顕著に低減しています。また、強化学習は「先に考え、その後に答える」推論プロセスに初めて導入され、モデルの論理的正確性と精度を向上させました。

本日から、ChatGPT Plus、Pro、チームユーザーはGPT-5をデフォルトモデルとして切り替えることができます。無料ユーザーは段階的に容量が解放され、企業・教育版は1週間後に全面的に開放されます。Proユーザーは無制限に利用でき、より強力なProモードを独占利用できます。Plusユーザーは無料プランよりはるかに高い容量を享受します。チームおよび企業の顧客は組織全体でシームレスに配置できます。OpenAICEOのサム・アルトマン氏はライブ配信の終わりに、「GPT-5が人間の脳の延長線となることを願っています」と述べ、業界に「汎用人工知能の臨界点」に関する無限の想像力を与えました。