OpenAI 宣佈對其 AI 智能體開發工具進行了一系列重要升級。此次更新不僅提升了平臺的兼容性,還對語音界面進行了優化,同時增強了可觀測性(observability),使得開發者在構建 AI 智能體時能更加得心應手。

image.png

OpenAI 爲其 Agents SDK 新增了對 TypeScript 的支持。這一舉措讓 JavaScript 和 Node.js 環境下的開發者也能參與到智能體的開發中。新版本與之前的 Python 版本在功能上保持一致,包含了 Handoffs(任務轉交機制)、Guardrails(運行時行爲約束)和 Tracing(執行追蹤)等核心組件。此外,模型上下文協議(MCP)確保智能體在執行過程中能夠順暢地傳遞上下文信息,開發者可以在前端瀏覽器和後端 Node.js 環境中無縫構建智能體。

OpenAI 推出了 RealtimeAgent 功能,以支持低延遲的語音應用。該功能集成了音頻輸入輸出、狀態交互及中斷處理等功能,特別引入了人機迴路(HITL)審批機制。開發者在執行智能體時可以選擇暫停,讓系統檢查當前狀態,並在手動確認後再繼續執行。這種機制特別適合需要監管和合規檢查的應用場景,確保智能體的行爲可控。

OpenAI 還對 Traces 儀表盤進行了升級,支持對 Realtime API 的會話進行追蹤。更新後的儀表盤能夠覆蓋音頻輸入輸出、工具調用及用戶中斷等環節,並提供統一的審計記錄,簡化了調試和性能優化的過程。

OpenAI 還對語音對語音模型進行了改進,旨在降低延遲、提升對話的自然性和中斷處理能力。更新後,系統能夠實現更快的流式響應、更具表現力的音頻生成及對重疊輸入的穩健應對,這些改進爲動態多模態對話智能體的構建奠定了基礎。

劃重點:

🌟 TypeScript 支持:OpenAI 的 Agents SDK 新增了 TypeScript 支持,擴大了開發者生態,方便不同環境的開發者使用。

🎤 RealtimeAgent 功能:新功能支持低延遲語音應用,開發者可在執行時暫停並手動確認智能體的狀態。

🔍 語音模型改進:對語音對語音模型進行了優化,降低延遲,提高了對話自然性與中斷處理能力。