OpenAIはこのほど、Agents SDKを大幅にアップデートし、開発者向けに複数の重要な機能更新を導入しました。今回のアップデートではプログラミング言語のサポートが拡張され、革新的な音声インタラクション技術も導入されました。

Agents SDKは現在、TypeScriptを正式にサポートしており、Pythonバージョンと同等の機能を提供しています。細かい制御機構や人工承認オプションを利用することで、AIエージェントの動作をより正確に管理できます。このSDKは、複数のエージェントワークフローを簡素化するために設計されており、カスタマイズ可能な言語モデル、エージェント切り替え機能、内蔵セキュリティコントロール、そして完全な分析ツールキットを備えています。

OpenAI、ChatGPT、人工知能、AI

音声エージェント技術の革新

新しく追加されたRealtimeAgent機能は、今回のアップデートのハイライトです。開発者は、クライアント側とサーバー側で動作する音声エージェントを作成できるようになり、音声操作のブレークイン機能をサポートし、会話中にリアルタイムで各種ツールを呼び出すことができます。

「Traces」ダッシュボードも大幅に改良され、音声エージェントのリアルタイム実行データを表示します。これには、オーディオストリームの状態、ツールの使用状況、ブレークイン回数の統計などが含まれており、開発者にとって包括的なパフォーマンスモニタリングを提供します。

また、これらの機能を支える基盤となる言語モデルも改善されています。「GPT-4O-Realtime-Preview-2025-06-03」バージョンは、指示の実行精度、ツール呼び出しの信頼性、および中断処理の洗練度において顕著な向上を見せ、このモデルはリアルタイムおよびチャットAPIを通じて開発者に公開されています。

API戦略の調整

製品ロードマップにおいて、OpenAIは2026年の中頃に機能の同等性を達成した後、従来のAssistants APIの段階的な廃止を進め、新しいResponses APIに完全に移行する計画です。Chat Completions APIは引き続き、ツール統合を必要としない開発者向けにサービスを提供しますが、OpenAIは開発者が Responses APIに早期に移行することをお勧めしています。これにより、さらに強力な拡張機能が利用可能になります。

Agents SDKは、OpenAI APIおよび他のChat Completions標準に準拠するサードパーティのモデルプロバイダーとも完全に互換性があり、開発者の選択肢を広げています。