近日,人工智能公司 Inworld 正式發佈了其最新的文本轉語音模型 TTS-1.5。該模型以其自然、富有表現力的實時語音而備受關注,能夠在低延遲的情況下提供多語言支持。

根據官方介紹,TTS-1.5的使用成本約爲每分鐘0.005美元,聲稱比市場上的同類產品便宜25倍,這一價格無疑將吸引大量用戶的關注。

image.png

TTS-1.5在技術上實現了低於250毫秒的實時延遲,這意味着用戶可以在對話中幾乎感覺不到任何延遲。語音合成技術的提升,不僅在速度上有了顯著改善,模型在表達力和穩定性方面也進行了優化。這爲各種應用場景,尤其是遊戲和虛擬現實領域的對話系統提供了新的可能性。

除了極具競爭力的價格,用戶對低延遲的需求也在不斷上升。許多用戶認爲,延遲是文本轉語音技術面臨的一大挑戰。如今,Inworld 的這一創新成果爲實現更真實的對話體驗鋪平了道路。用戶在社交平臺上對這一技術表現出了濃厚的興趣,並期待能在自己的項目中應用這一新模型。

劃重點:

📢 TTS-1.5模型推出,具備自然的語音合成和多語言支持。

💰 該模型每分鐘費用約爲0.005美元,比市場同類產品便宜25倍。

⚡ 實現低於250毫秒的實時延遲,爲用戶提供更真實的對話體驗。