今日,字節跳動旗下雲服務平臺火山引擎宣佈,豆包大模型已支持實時語音通話新功能。

據悉,火山引擎提供的對話式 AI 實時交互解決方案,結合了火山方舟大模型服務平臺和豆包的語音識別與合成模型,簡化了語音到文本和文本到語音的轉換過程。這一方案實現了高效的語音數據採集、處理和傳輸,提供了卓越的智能對話和自然語言處理能力。

字節跳動抖音豆包大模型

火山引擎 RTC 基於音頻3A 處理技術,有效解決了“雙講”現象,確保語音識別的準確性和實時性。同時,利用 WebRTC 傳輸網絡,實現了全球範圍內的超低延遲、穩定可靠的實時音視頻傳輸服務。

火山引擎還提供了靈活、多樣化的接入方案,包括自集成方案和基於 WebRTC 標準協議的傳輸網絡方案,以滿足不同企業的具體需求。

此外,火山引擎的大模型多模態實時交互服務已爲國內一些頭部 AI 虛擬人物聊天應用提供了 AI 實時語音能力,帶來了全新的互動體驗。火山引擎將持續提供高質量的音視頻能力和 AI 能力,助力企業在 AI 實時音視頻領域實現創新。