TEN Agent團隊近日宣佈,其核心模型**TEN Voice Activity Detection (VAD)**和**TEN Turn Detection**正式開源,爲構建實時、多模態的語音AI代理提供了強大的技術支持。

這一舉措標誌着TEN框架在推動語音交互技術民主化與開源協作方面的重大進展。以下是AIbase整理的最新資訊,深入解析這兩大核心模型的功能、優勢及對行業的潛在影響。

image.png

TEN VAD:低延遲高性能的語音活動檢測

TEN VAD是一款專爲企業級應用設計的實時語音活動檢測器,以低延遲、輕量化和高性能著稱。根據官方信息及社交媒體反饋,TEN VAD能夠精確到幀級別檢測語音活動,顯著優於業界常用的WebRTC VAD和Silero VAD。以下是其核心亮點:

- **低計算複雜度**:TEN VAD的庫體積小,計算複雜度低,支持跨平臺C語言兼容,覆蓋Linux x64、Windows、macOS、Android和iOS等多種操作系統,同時提供針對Linux x64的Python綁定和Web端的WASM支持。[](https://huggingface.co/TEN-framework/ten-vad)

- **高精度與低延遲**:相比Silero VAD,TEN VAD在語音到非語音的轉換檢測中延遲更低,能快速識別短暫停頓,適合實時交互場景。測試顯示,其實時因子(RTF)在多種CPU平臺上表現優異。[](https://huggingface.co/TEN-framework/ten-vad)

- **最新開源進展**:2025年6月,TEN團隊開源了ONNX模型及預處理代碼,支持在任何支持ONNX的平臺和硬件架構上部署,進一步增強了靈活性。此外,WASM+JS的支持擴展了其在Web端的應用可能性。

社交媒體上,開發者對TEN VAD的開源表示高度認可,認爲其性能超越傳統VAD模型,爲實時語音助手開發提供了強有力的工具。

TEN Turn Detection:智能對話輪次管理

**TEN Turn Detection**是一款專爲全雙工語音通信設計的智能輪次檢測模型,旨在解決人機對話中最具挑戰性的問題之一:準確判斷用戶何時結束髮言並進行上下文感知的中斷處理。以下是其關鍵特性:

- **語義分析能力**:基於Qwen2.5-7B的Transformer模型,TEN Turn Detection通過分析對話的語義上下文和語言模式,精準區分用戶發言的“完成”、“等待”和“未完成”狀態。例如,它能識別“嘿,我想問個問題……”爲未完成發言,從而避免不必要的AI打斷。[](https://huggingface.co/TEN-framework/TEN_Turn_Detection)

- **多語言支持**:目前支持英語和中文,能夠準確識別多語言對話中的輪次信號,適用於全球化應用場景。[](https://huggingface.co/TEN-framework/TEN_Turn_Detection)

- **優異性能**:在公開測試數據集上,TEN Turn Detection在各項指標上均超越其他開源輪次檢測模型,尤其在動態實時對話中表現出色。[](https://huggingface.co/TEN-framework/TEN_Turn_Detection)

- **自然交互體驗**:結合TEN VAD,TEN Turn Detection使AI代理能夠像人類一樣等待合適的發言時機,或在適當的語境下處理用戶中斷,從而打造更自然的對話體驗。[](https://www.agora.io/en/blog/making-voice-ai-agents-more-human-with-ten-vad-and-turn-detection/)

TEN Agent生態:多模態實時AI的基石

TEN Agent是TEN框架的展示項目,整合了TEN VAD、TEN Turn Detection等核心組件,支持語音、視頻、文本等多模態實時交互。以下是其在生態中的作用:

- **無縫集成**:TEN VAD與TEN Turn Detection作爲TEN框架的插件,開發者可通過簡單配置將其融入語音代理開發流程,支持與Deepgram、ElevenLabs等服務的集成。

- **多場景應用**:TEN Agent支持從智能客服、實時翻譯到虛擬伴侶等多種用例。例如,結合Google Gemini多模態API,TEN Agent可實現實時視覺和屏幕共享檢測,擴展了其在教育、醫療等領域的應用。

- **開源協作**:TEN框架的全部組件(除TEN VAD部分代碼外)均已完全開源,鼓勵社區開發者貢獻代碼、修復Bug或提出新功能。TEN團隊通過GitHub Issues和Projects提供協作渠道,吸引了廣泛的開發者參與

項目:https://github.com/TEN-framework/ten-framework