OpenAIは正式にChatGPT Agentをリリースしました。この新たなAIツールは、人工知能が対話アシスタントから自律的なタスク実行者へと進化する大きな飛躍を示しています。ChatGPT Agentは、以前にOpenAIがリリースしたOperatorとDeep Researchの機能を統合しており、仮想ブラウザーや端末、APIへのアクセスを通じて、複雑なタスクを自律的に遂行できます。これにより、ユーザーの時間を節約し、効率を向上させます。

image.png

コア機能:会話から行動へ

ChatGPT Agentはテキストでの会話にとどまらず、ネット上で閲覧やクリック、フォーム入力、コードの実行やAPIの呼び出しも可能です。多様なタスクを処理でき、例えば結婚式の予算やスタイルに合わせた衣装選び、旅行スケジュールの作成、専門的なレポートやスライドの作成などにも対応します。OpenAIは、このエージェントがGPT-4oモデルによって駆動され、Operatorのウェブインタラクション機能とDeep Researchの深層研究機能を組み合わせ、統一されたスマートシステムを構築したと説明しています。ユーザーは単一の指示を与えるだけで、エージェントがマルチステップのタスクを自律的に完了し、生産性を大幅に向上させます。

image.png

パフォーマンス:業界の基準を上回る

ChatGPT Agentは、多数のベンチマークテストで優れたパフォーマンスを示しています。「Humanity’s Last Exam」テストでは、正確率が41.6%に達し、以前のOpenAI o3モデルの20.3%やDeep Researchの26.6%を大きく上回っています。投資銀行のモデリングタスクでは、平均正確率が71.3%に達し、ExcelやPowerPointに関連するタスクにおいてもマイクロソフトのCo pilotなどの競合よりも優れています。また、BrowseCompやWebArenaなどのウェブナビゲーションタスクでは、それぞれ68.9%と65.4%のパフォーマンスを示し、強力な実用性を証明しています。

セキュリティと制限:ユーザーの制御が中心

OpenAIは、ChatGPT Agentの設計においてセキュリティを重視しています。パスワードや支払いなど「高コスト」の操作を行う際には、ユーザーからの明確な許可を求め、いつでもタスクを停止・中断・引き継ぐことが可能です。悪意のあるウェブサイトやプロンプトインジェクション攻撃を防止するために、OpenAIは厳格な保護策を講じており、敏感な操作(例:銀行振込)の制限やブラウジングデータの自動削除を行っています。さらに、Agentは「高い生物・化学能力レベル」として分類され、追加のセキュリティ保障が適用されます。

利用可能性と今後の計画

現在、ChatGPT AgentはChatGPTのPro、Plus、Teamユーザー向けに公開されています。Proユーザーは月に400回のタスク枠を提供され、PlusおよびTeamユーザーは40回です。枠を超えた場合、追加のタスク枠を購入できます。OpenAIは今後数週間以内に企業および教育ユーザーへのアクセス権拡大を計画しています。ただし、EUおよびスイスではまだリリースされていません。OpenAIは、この機能がより強力なモデル(噂されているGPT-5など)への道を開くものであることを明らかにし、今後、支払い決済システムなどの機能を統合する可能性があると述べています。

ChatGPT Agentのリリースは、AI業界の競争が激化している中で行われました。マイクロソフトのCo pilot、グーグルのGemini、xAIのGrokはいずれもデジタル生産性インターフェースの主導権を争っています。OpenAIはAgentのリリースを通じて、生成型AI分野における地位を強化し、伝統的な検索やオフィスソフトウェアに対して挑戦を開始しました。業界関係者は、ChatGPT Agentがユーザーとネットワーク、生産性ツールとの相互作用を再定義する可能性があり、AI駆動の自動化の新基準となると考えています。

AIbase