語音交互領域迎來里程碑式突破!國內AI公司階躍(Step Audio)近日震撼開源了一款



語音交互領域迎來里程碑式突破!國內AI公司階躍(Step Audio)近日震撼開源了一款


AI編程進入語音交互時代,Anthropic爲開發者工具Claude Code引入語音模式,支持通過語音指令執行復雜編程任務,目前已在Windows平臺推出。
OpenAI推出兩項API更新,提升AI智能體在語音交互與複雜任務中的性能。全新實時模型gpt-realtime-1.5及配套音頻模型,顯著提高語音命令可靠性。內部測試顯示,新模型在數字字母轉錄準確率上提升約10%,邏輯音頻任務準確率提高5%,指令執行準確率提升7%。
OpenAI正整合團隊重構音頻AI系統,計劃2026年推出音頻優先設備,押注語音交互成爲後屏幕時代核心。
Pinterest推出AI購物助手,週四起逐步上線。用戶可通過語音對話獲取個性化時尚搭配建議,助手基於用戶收藏和當前圖片推薦商品,並以語音簡述結果。CEO稱此舉旨在提升互動體驗,目前僅支持語音輸入。
就在各家AI大模型競相迭代之際,一家備受矚目的人工智能初創公司Anthropic正悄然醞釀着一項重大升級——爲旗下AI聊天機器人Claude賦予“說話”的能力。Anthropic首席產品官邁克・克里格(Mike Krieger)近日向英國《金融時報》透露,公司正積極探索一系列全新的用戶體驗,讓用戶能夠直接通過語音與強大的Claude AI模型進行交流。克里格指出,隨着Claude的應用場景不斷拓展,尤其是在桌面端,語音交互有望成爲一種更加自然和高效的用戶界面。“我們正在深入研究桌面端的Claude如何進一步發展