ZyphraAI 近日發佈了其最新的多語言文本到語音(TTS)模型 Zonos-TTS,該模型基於 Apache2.0許可證,完全開源且可商用。Zonos-TTS 不僅支持實時語音克隆功能,還經過20萬小時的英語語音數據訓練,表現出卓越的性能。

Zonos-TTS 提供了兩種部署方式:支持本地部署和便捷的 API 服務。對於普通用戶,ZyphraAI 提供每月免費生成 100分鐘音頻的服務;專業版用戶則可以選擇 300分鐘/5美元的套餐,超出部分按每分鐘 0.02美元計費。

特別值得一提的是,實時語音克隆功能完全免費,且支持高音頻質量和情感控制,爲用戶提供了極大的靈活性和實用性。

此外,Zonos-TTS 還支持音頻前綴輸入,進一步提升了其應用場景。根據 ZyphraAI 的測試,在 RTX4090顯卡上,該模型能夠以約 2倍實時速度運行,展現出極高的效率。此次開源發佈爲開發者和企業提供了一個強大且靈活的工具,助力多語言實時語音克隆技術的發展。

地址:https://huggingface.co/Zyphra/Zonos-v0.1-hybrid