近日,一款名爲Qwen-TTS的語音合成模型有了新進展,其通過Qwen API完成了最新版本的更新,爲用戶帶來了更加豐富的語音合成體驗。

此次更新中,Qwen-TTS新增了對三種中文方言的支持,分別是北京話、上海話和四川話,進一步拓寬了其應用場景。該模型依託超過300萬小時的大規模語料庫進行訓練,合成效果達到了人類級別的自然度和表現力。Qwen-TTS不僅能精準合成語音,還能根據輸入文本自動調整韻律、節奏和情緒變化,讓生成的語音更加真實、富有表達力。

通義 Qwen (5)

目前,Qwen-TTS已經支持七種中英雙語音色,包括Cherry、Ethan等標準音色,以及特別爲方言設計的Dylan(北京話)、Jada(上海話)和Sunny(四川話)等音色。用戶可以根據自己的需求,選擇合適的音色進行語音合成。

在實際應用中,Qwen-TTS展現出了出色的性能。無論是描述日常生活的場景,還是表達複雜的情感,它都能生成自然流暢的語音。例如,在使用北京話音色的Dylan合成關於童年遊戲的文本時,語音中充滿了童趣和活力;而使用上海話音色的Jada合成關於生活瑣事的對話時,則透露出一種地道的滬上風情。

Qwen-TTS的開發團隊表示,未來他們將繼續優化模型性能,並計劃推出更多語言和語音風格,以滿足用戶日益多樣化的需求。同時,他們也提供了簡便的API接口,方便開發者將Qwen-TTS集成到自己的應用中。

百鍊:https://help.aliyun.com/zh/model-studio/qwen-tts