近日,Deepdub 宣佈推出其最新的語音 AI 模型 Lightning2.5。這款模型被稱爲公司迄今爲止最快、最具可擴展性的語音解決方案,專爲實時生產級語音體驗而設計。Lightning2.5在多語言 AI 代理、呼叫中心自動化、實時內容本地化以及個性化媒體和遊戲等應用場景中展現了卓越的支持能力。

Lightning2.5的開發基於 Deepdub 自主研發的語言和語音基礎模型,結合了人類水平的表達能力和高保真度,支持多種語言。這款模型在實時性能方面進行了基礎設施的擴展,能夠保留說話者的身份、語調和情感細膩之處,從而爲用戶提供逼真的生產級語音體驗。

Deepdub 的首席執行官兼聯合創始人 Ofir Krakowski 表示:“Lightning 代表了實時、富有表現力的語音生成技術的一次重大進步。無論是驅動多語言 AI 代理、沉浸式內容平臺,還是大規模的語音優先自動化,Lightning 都能夠以客戶所需的速度、保真度和質量,將基礎語音 AI 推向生產應用。”

這款新模型配備了重新設計的推理引擎,帶來了2.8倍的吞吐量和5倍的併發能力,延遲低至200毫秒,比行業標準快了半秒。這使得 Lightning 非常適合在實時語音交互、動態語音解說以及事件驅動的 AI 流程中應用,尤其適用於自主語音代理、交互系統和大規模語音自動化等多個行業。

作爲 NVIDIA 初創企業孵化計劃的一員,Deepdub 針對多種 NVIDIA GPU(如 H100、A100、L40S 和 A10G)進行了 Lightning 的優化,支持本地和雲環境的部署。通過利用 NVIDIA TensorRT-LLM 加速堆棧,Lightning 在企業規模下實現了高吞吐量、低延遲的推理,同時保持了高效的運營成本。

NVIDIA 媒體與娛樂副總裁 Richard Kerris 指出:“組織對於能夠結合逼真質量、速度和可擴展性的實時語音 AI 需求日益增長。Deepdub 通過基於 NVIDIA GPU 和 TensorRT-LLM 構建 Lightning2.5,使多語言語音體驗具備超低延遲和高併發能力,幫助客戶在全球範圍內交付下一代 AI 代理、沉浸式內容和企業語音應用。”

Deepdub 將在2025年國際廣播會議(IBC)上展示 Lightning,屆時將進行實時語音本地化、動態內容自動化和可擴展語音管道的現場演示。感興趣的朋友可以前往 AI 展區,Hall14,Booth14.B53體驗 Lightning 的魅力。

劃重點:  

🎤 Lightning2.5是 Deepdub 最新推出的實時語音 AI 模型,具有2.8倍的吞吐量和5倍的併發能力。  

🌍 新模型支持多語言應用,適用於 AI 代理、呼叫中心自動化等多個場景。  

⚡ Deepdub 將在 IBC2025展會上進行 Lightning 的現場演示,展示其強大功能。