Hume AI重磅發佈EVI 3：懂你情緒的語音AI，比GPT-4o還快！

近日，Hume AI正式發佈了其第三代語音交互模型EVI3，這一全新語音AI以其卓越的情感理解能力和個性化交互體驗引發業界廣泛關注。EVI3不僅能精準識別用戶語音中的情緒，還能根據用戶喜好生成特定風格的聲音和個性，標誌着語音AI在情感交互和自然溝通領域的重大突破。以下，AIbase爲您帶來關於EVI3的最新資訊和深度解析。

體驗地址：https://demo.hume.ai/

EVI3:情感智能與語音交互的完美融合

EVI3是Hume AI基於多模態數據集研發的第三代語音語言模型，集語音轉錄、推理和語音合成於一體。相較於前代模型，EVI3在情感理解、語音表達的自然度和個性化定製方面實現了質的飛躍。據官方介紹，該模型能夠通過用戶輸入的簡單文本提示，在不到一秒的時間內生成全新的聲音和人格設定，支持超過30種複雜的語音風格，賦予AI獨特的“性格”或“情緒”。

例如，用戶可以通過描述生成“老派喜劇演員”或“睿智巫師”等多樣化角色聲音，EVI3不僅能精準模仿指定風格，還能根據對話情境動態調整語氣和表達方式。這種高度個性化的交互體驗，讓EVI3在客戶服務、虛擬助手、內容創作等場景中展現出巨大潛力。

超低延遲與智能響應:技術性能全面領先

EVI3的推理延遲低至300毫秒，響應速度顯著優於OpenAI的GPT-4o，接近新興技術Sesame，並遠超Google的Gemini。在包含1，720名參與者的盲測中，EVI3在情感表達、自然度、語音質量、響應速度、打斷處理等七個維度上均超越了GPT-4o，展現出無與倫比的性能優勢。

更令人矚目的是，EVI3能夠在對話中實時進行搜索、推理和智能回答。例如，用戶在與AI交談時，EVI3可以一邊“傾聽”用戶語音，一邊調用外部工具獲取信息，並在對話中無縫融入答案，極大提升了交互的流暢性和實用性。這種端到端的語音處理能力，使得EVI3成爲當前語音AI領域的標杆。

情感識別:讓AI更懂人類

EVI3的另一大亮點是其強大的情感識別能力。通過分析用戶語音的音調、節奏和音色，EVI3能夠精準捕捉用戶的情緒狀態，並據此調整自身的迴應語氣，營造出更自然、共情的人機交互體驗。相比傳統語音助手，EVI3在情感表達上的細膩程度更勝一籌，能夠模擬人類對話中的停頓、語氣變化甚至“umm”等自然口語習慣。

Hume AI表示，EVI3通過強化學習技術對音高、語速和情感風格進行了優化，訓練數據涵蓋了超過10萬個語音樣本。這種獨特的多模態訓練方法，使得EVI3能夠從海量數據中提取人類語音的細微特徵，從而生成更真實、更具感染力的語音表達。

多場景應用:從客服到內容創作的無限可能

EVI3現已通過Hume AI的iOS應用和在線演示平臺向用戶開放體驗，API接口也將在未來幾周內推出，供開發者集成到各類應用中。無論是用於客戶服務、健康教練、沉浸式故事敘述，還是虛擬伴侶，EVI3都能提供高度個性化和情感化的交互體驗。

例如，在客戶服務場景中，EVI3能夠根據用戶的情緒狀態調整語氣，提供更貼心的迴應;在內容創作領域，創作者可以利用EVI3生成定製化的有聲書或遊戲角色配音，極大地豐富了創作可能性。Hume AI還計劃進一步優化EVI3的多語言能力，未來將更熟練地支持法語、德語、意大利語和西班牙語等語言，拓展全球市場。

Hume AI的願景:以情感驅動AI未來

Hume AI由前DeepMind研究員Alan Cowen於2021年創立，致力於打造以人類情感和福祉爲核心的AI技術。EVI3的發佈是Hume AI實現其願景的重要一步。官方表示，到2025年底，Hume AI的目標是打造一個完全個性化的語音AI體驗，讓語音交互成爲人與AI溝通的主要方式。

相較於OpenAI和Anthropic等巨頭專注於提升模型的通用智能，Hume AI更注重語音AI的真實感和情感共鳴。EVI3通過自然語言定製工具，讓用戶無需複雜的技術操作即可創建專屬AI聲音，這種用戶友好的設計有望推動語音AI的普及和應用。

EVI3的發佈無疑爲語音AI領域注入了新的活力。其在情感識別、低延遲響應和個性化定製方面的突破，不僅挑戰了現有語音AI模型的性能極限，也爲未來的AI交互方式指明瞭方向。AIbase認爲，EVI3的出現標誌着語音AI從機械化的語音助手向真正“懂你”的智能夥伴邁出了關鍵一步。

Hume AI重磅發佈EVI 3：懂你情緒的語音AI，比GPT-4o還快！

相關推薦

研究人員推出LPM1.0模型:實現單圖轉實時交互式數字人視頻

算力本地化：Speechify 推出原生 Windows 應用挑戰系統級聽寫

微軟開源前沿語音 AI 家族 VibeVoice：單次處理 90 分鐘多說話人對話，GitHub 迅速獲 27K Star

Hume AI開源TADA：5倍速零幻覺TTS，能在手機上跑700秒長音頻

班加羅爾初創企業 Arrowhead 融資 300 萬美元拓展語音 AI 能力

Hume AI重磅發佈EVI 3：懂你情緒的語音AI，比GPT-4o還快！

相關推薦

研究人員推出LPM1.0模型:實現單圖轉實時交互式數字人視頻

算力本地化：Speechify 推出原生 Windows 應用挑戰系統級聽寫

微軟開源前沿語音 AI 家族 VibeVoice：單次處理 90 分鐘多說話人對話，GitHub 迅速獲 27K Star

Hume AI開源TADA：5倍速零幻覺TTS，能在手機上跑700秒長音頻

​班加羅爾初創企業 Arrowhead 融資 300 萬美元 拓展語音 AI 能力

班加羅爾初創企業 Arrowhead 融資 300 萬美元拓展語音 AI 能力