OpenAI近日宣佈對其Agents SDK進行全面升級,爲開發者帶來多項重要功能更新。此次升級不僅擴展了編程語言支持,還引入了突破性的語音交互技術。
Agents SDK現已正式支持TypeScript,功能與Python版本完全一致。開發者可以利用細粒度控制機制和人工審批選項,更精確地管理AI代理行爲。該SDK專爲簡化多代理工作流程而設計,提供可配置的語言模型、代理切換功能、內置安全控制和完整的分析工具套件。
語音代理技術突破
新推出的RealtimeAgent功能是此次升級的亮點。開發者現在可以創建既能在客戶端又能在服務器端運行的語音代理,這些代理支持語音打斷功能,並可在對話過程中實時調用各種工具。
配套的"Traces"儀表板也進行了重大更新,能夠顯示語音代理的實時運行數據,包括音頻流狀態、工具使用情況和打斷次數統計,爲開發者提供全面的性能監控.
OpenAI同時改進了支撐這些功能的底層語言模型。更新後的"GPT-4O-Realtime-Preview-2025-06-03"版本在指令執行準確性、工具調用可靠性和中斷處理優雅度方面都有顯著提升,該模型已通過實時和聊天API向開發者開放。
API戰略調整
在產品路線圖方面,OpenAI計劃在2026年中期實現功能對等後,逐步淘汰現有的Assistants API,全面轉向新的Responses API。Chat Completions API將繼續爲不需要工具集成的開發者提供服務,但OpenAI建議開發者儘早過渡到Responses API以獲得更強大的擴展功能。
Agents SDK與OpenAI API以及其他遵循Chat Completions標準的第三方模型提供商完全兼容,爲開發者提供了靈活的選擇空間。