AIbase 報道,xAI 正式發佈了 Grok 語音代理 API,以每分鐘僅 0.05美元的極具競爭力價格,在實時語音 AI 領域掀起了性能與性價比的雙重風暴。該模型在音頻推理基準測試中高居榜首,憑藉不足1秒的首音延遲,實現了比競品快近5倍的響應速度。

技術上,Grok 語音代理不僅支持包括中文在內的數十種語言自動檢測與自由切換,更深度集成了實時網頁搜索與推理能力,使其回覆能夠緊跟全網最新資訊。通過支持外部工具調用、情緒控制及多種語音選項,開發者可以構建出極具表現力且能執行實際任務的 AI 智能體。

值得一提的是,該 API 完全兼容 OpenAI 實時 API 規範,這爲追求高性能、低成本方案的開發者提供了無縫遷移的可能,標誌着馬斯克在實時對話 AI 賽道上正式邁出了挑戰行業格局的關鍵一步。