亞馬遜推新一代AI語音模型Nova Sonic，捕捉語氣、語調變化和節奏

亞馬遜近日推出了一款新型 AI 語音模型 ——Nova Sonic，旨在提升其語音助手 Alexa + 的性能。Nova Sonic 被設計用於本地處理語音並生成自然流暢的回覆，標誌着亞馬遜在語音識別技術領域的又一次突破。

Nova Sonic 採取了一種全新的整合方式，將語音理解和生成的能力統一到一個模型中。這一創新不僅簡化了語音應用的開發過程，還能根據語音輸入的聲學背景（如語調和風格）來調整生成的語音響應，從而實現更加自然的對話。Nova Sonic 甚至能夠理解人類對話中的細微之處，包括說話者的自然停頓和猶豫，能夠在適當的時候等待說話，並優雅地處理插話情況。

例如，在一個虛擬旅行助手的對話中，當客戶從興奮轉爲擔憂時，AI 的語氣會隨之變得更加安撫，幫助客戶獲取相關的價格信息。此外，Nova Sonic 還能爲用戶的語音生成文本轉錄，使開發者能夠利用這些文本調用特定的工具和 API，從而構建更爲強大的語音 AI 代理。

根據亞馬遜的介紹，Nova Sonic 在速度、語音識別和通話質量等關鍵指標上，與 OpenAI 和谷歌的領先語音模型相匹敵。該模型已通過亞馬遜的 Bedrock 開發平臺向開發者開放，亞馬遜聲稱其成本比 OpenAI 的 GPT-4o 低80%。雖然 OpenAI 也提供了一種更爲實惠的選擇 ——GPT-4o-Mini，但 Nova Sonic 的推出無疑爲市場帶來了更多選擇。

Nova Sonic 的最大亮點之一是其在複雜環境下的語音識別能力。這意味着，在嘈雜或干擾的背景中，該模型依然能夠有效地識別用戶的指令，並進行準確迴應。此外，Nova Sonic 還具備高效處理用戶請求的能力，能夠靈活地將請求路由到不同的 API，實現更快速的響應。

亞馬遜的 SVP 兼首席科學家 Rohit Prasad 表示，Nova Sonic 的推出不僅是技術的進步，也是公司在人工智能領域持續創新的體現。他提到，隨着語音助手在日常生活中的應用越來越廣泛，提升語音識別的準確性和響應速度顯得尤爲重要。

作爲智能家居的核心組成部分，Alexa + 的表現直接影響用戶體驗。通過引入 Nova Sonic，亞馬遜希望能夠進一步提升用戶與設備的互動體驗，提供更加自然、流暢的對話能力。

官方博客:https://www.aboutamazon.com/news/innovation-at-amazon/nova-sonic-voice-speech-foundation-model

劃重點:
🌟 Nova Sonic 是亞馬遜新推出的 AI 語音模型，旨在提升 Alexa + 的性能。
💰 該模型的成本比 OpenAI 的 GPT-4o 低80%，爲開發者提供更多選擇。
🔊 Nova Sonic 具備在複雜環境下的語音識別能力，能夠快速準確地處理用戶請求。

亞馬遜推新一代AI語音模型Nova Sonic，捕捉語氣、語調變化和節奏

相關推薦

亞馬遜在印度啓動生成式AI助手 Alexa+ 印地語版 Beta 測試

Alexa+ 上線按需播客功能想聽啥自己點！

亞馬遜生成式AI助手Alexa+登陸德國，Prime會員享專屬免費權益

月費19.99美元!亞馬遜新版 AI 助手 Alexa+ 登陸美國市場

亞馬遜正式推出Alexa +專屬網站Alexa.com 正式向 ChatGPT 宣戰！

亞馬遜推新一代AI語音模型Nova Sonic，捕捉語氣、語調變化和節奏

相關推薦

亞馬遜在印度啓動生成式AI助手 Alexa+ 印地語版 Beta 測試

Alexa+ 上線按需播客功能 想聽啥自己點！

亞馬遜生成式AI助手Alexa+登陸德國，Prime會員享專屬免費權益

月費19.99美元!亞馬遜新版 AI 助手 Alexa+ 登陸美國市場

亞馬遜正式推出Alexa +專屬網站Alexa.com 正式向 ChatGPT 宣戰！

Alexa+ 上線按需播客功能想聽啥自己點！