GPT-5が新たなセキュリティメカニズムを導入: 入力の審査から出力のモニタリングへ

OpenAIが最新リリースしたGPT-5モデルは、セキュリティメカニズムにおいて大きな進歩を遂げました。ユーザーの要求を単純に拒否するのではなく、より知的な「セキュリティ補完」戦略を採用しています。

核心的な改善点：二元的な拒否から知的な説明へ

従来、ChatGPTがユーザーの要求がコンテンツガイドラインに違反すると判断した場合、短い謝罪と拒否のみを返していました。GPT-5はこのモデルを完全に変え、セキュリティの中心をユーザー入力の分析からAI出力のモニタリングに移しました。

"我々の拒否の仕方は過去とは大きく異なります。" OpenAIのセキュリティシステム研究チームのSaachi Jainは述べています。新しいモデルは、規則に違反している理由を説明するだけでなく、適切なタイミングで代替のトピックを提案し、ユーザーに建設的なインタラクション体験を提供します。

ChatGPT

段階的対応：すべての違反が同じように重大ではない

GPT-5はリスクの段階的評価を導入し、潜在的な危害の深刻さに基づいて異なる対応戦略を採用しています。"すべてのポリシー違反が同じように扱われるわけではない。ある間違いは他の間違いよりも深刻であることがある。"Jainは説明しています。

この変化により、ChatGPTはセキュリティルールを守りながらも、一括りの拒否ではなく、より柔軟で役立つ返答を提供できるようになりました。

実際の体験：日常的な使用感は似ている

セキュリティメカニズムがアップグレードされたにもかかわらず、通常のユーザーにとっての日常的な質問—健康問題、レシピの作成、学習ツールなど—では、GPT-5のパフォーマンスは以前のバージョンとほとんど変わりません。新モデルは通常のリクエストを処理する際、常に実用性を維持しています。

課題も残る：個別化機能が新たなリスクをもたらす

注目すべきは、AIツールの個別化機能が強化されるにつれて、セキュリティ制御がさらに複雑になることです。テスト結果によると、カスタム命令などの機能を通じて、一部のセキュリティ制限はまだ回避可能であることが示されています。これは、AIのセキュリティが継続的に進化する課題であることを思い出させます。

LMArenaが最新のAI大規模モデルランキングを発表：Claude、GPT-5および智譜GLM-4.6が並んで第一位

LMArenaによる最新のAIプログラミングモデルランキングによると、AnthropicのClaude、OpenAIのGPT-5および智譜GLM-4.6が世界でトップに並んでいます。これらのプログラミングに特化したモデルは、コードの作成・デバッグ・最適化の効率を著しく向上させ、ソフトウェア開発を促進しています。

百度がERNIE-4.5-VL-28B-A3B-Thinkingを発表：画像の詳細を正確に特定し、複雑な問題を解決

百度は、多モーダルAIモデルであるERNIE-4.5-VL-28B-A3B-Thinkingをリリースしました。このモデルは画像と深く統合した推論が可能です。いくつかのベンチマークテストで優れた成績を収め、一部ではグーグルのGemini 2.5 ProやOpenAIのGPT-5Highなどのトップクラスの商用モデルを上回る性能を示しています。総パラメータ数は280億ですが、ルーティングアーキテクチャを採用しており、実際にアクティブ化されるパラメータは30億に過ぎず、軽量かつ効率的な推論を実現しています。

GPT-5.1が正式リリース！さらに賢くなっただけでなく、共感もできる：6つの新しいキャラクター風味を追加。AIは初めて感情依存のセキュリティ評価を導入

OpenAIがGPT-5.1を発表し、AI競争が感情知能の統合に新たな段階に入ったことを示している。このモデルは感情価値、パーソナライズされたインタラクション、人間らしい表現を強化しており、ユーザーからの「AIが冷たい」というフィードバックに対処している。2つのモデルアーキテクチャを使用：Instantモードで迅速な応答を行い、Thinkingモードで深い思考を行う。世界中で順次配信中であり、有料ユーザーは3か月間GPT-5への移行期間を経て使用可能である。