この度、Qwen3-TTS音声合成モデルは全面的なアップグレードを実施し、優れたパフォーマンスにより音声合成分野で注目を集める新鋭モデルとなりました。このバージョンは多様なボイス、多言語、多地域の方言をサポートしており、音声生成の自然さと安定性が向上しています。ユーザーはQwen APIを通じて簡単にこの強力な機能にアクセスできます。

image.png

Qwen3-TTSのボイスの種類は大幅に増加し、現在49種類以上の高品質なボイスを提供しており、異なる性別、年齢、地域の特徴をカバーしています。ユーザーはさまざまなシナリオで適切な声を見つけることができます。例えば、「甘えん坊でいたずら好きなモト」や「安心感のある小野杏」、または「厳格な墨講師」など、さまざまなキャラクターが利用可能です。豊富なボイスの選択肢により、合成された音声にはより表現力が生まれ、感情をより効果的に伝えることができます。

また、Qwen3-TTSは多言語および方言のサポートにおいても大きな進歩を遂げました。このモデルは中国語、英語、ドイツ語、フランス語などの主要な10言語をサポートしており、マルチリンガルテストでの平均単語誤り率(WER)は多くの競合製品よりも優れています。さらに、Qwen3-TTSは北京語、広東語、福建南語などの複数の地方話のボイス生成にも対応しており、地元の発音や言葉のニュアンスをリアルに再現することができ、より幅広いユーザーのニーズに対応します。

音声の自然さに関しては、Qwen3-TTSのアダプティブ調整能力が大幅に向上し、テキストの内容に応じて速度やリズムを柔軟に調整できるようになりました。人間のような擬人化の程度は非常に高く、ユーザーがQwen3-TTSを使用して音声合成を行う際には、より自然で滑らかな聴覚体験を得られます。

ユーザーインターフェースの面では、Qwen3-TTSは使いやすいAPIインターフェースを提供しており、開発者が迅速に統合できます。簡単なコードで、ユーザーは高品質な音声合成コンテンツを簡単に作成できます。このような設計は使用のハードルを下げ、より多くの人が先端的な音声合成技術を活用できるようにします。

Qwen3-TTS APIドキュメント:

https://help.aliyun.com/zh/model-studio/multi-round-conversation?spm=a2c4g.11186623.help-menu-2400256.d_0_1_1.49445002U6gJoz

ポイント:

🌟 Qwen3-TTSは49種類の高品質なボイスを追加し、多様なキャラクターがそれぞれのニーズに対応します。

🌍 10種類の主要言語と複数の方言をサポートし、地元の発音や特色をリアルに再現します。

🎤 音声の自然さが向上し、人間のように感じられるようになり、ユーザー体験がより向上しました。