最近、人工知能会社Inworldはその最新のテキストから音声への変換モデルTTS-1.5を正式にリリースしました。このモデルは、自然で表現力豊かなリアルタイムの音声で注目されています。低遅延において多言語対応を提供しています。

公式の説明によると、TTS-1.5の使用コストは約1分あたり0.005ドルであり、市場上の同種製品より25倍安いため、これは多くのユーザーの注目を集めること間違いなしです。

image.png

TTS-1.5は技術的に250ミリ秒未満のリアルタイム遅延を実現しており、ユーザーが会話の中でわずかな遅延も感じないことが可能です。音声合成技術の向上により、速度面での大幅な改善に加え、モデルの表現力と安定性も最適化されています。これは、特にゲームやバーチャルリアリティ分野における会話システムにとって新たな可能性をもたらします。

競争力のある価格に加え、ユーザーが求める低遅延へのニーズも増加しています。多くのユーザーは、遅延がテキストから音声への変換技術において大きな課題であると考えています。現在、Inworldのこのイノベーションは、より本物に近い会話体験を実現する道を開きました。ユーザーはSNS上でこの技術に強い関心を示し、自分のプロジェクトにこの新しいモデルを適用することを期待しています。

ポイント:

📢 TTS-1.5モデルが登場。自然な音声合成と多言語対応を備えています。

💰 このモデルの1分あたりの費用は約0.005ドルで、市場の同種製品よりも25倍安いです。

⚡ 250ミリ秒未満のリアルタイム遅延を実現し、ユーザーによりリアルな会話体験を提供します。