先日、ElevenLabsは画期的な新機能「音声デザイン」を発表しました。ユーザーは簡単なテキストプロンプトで全く新しい独自の音声を生成できます。

image.png

ElevenLabsの音声ライブラリには3,000種類以上の高品質な音声があり、日々増加していますが、それでも満足のいく音声が見つからない場合、音声デザイン機能がその空白を埋めるのに役立ちます。

ElevenLabsの音声デザイン機能の性能は?まずは公式が公開したサンプルをご覧ください。

これまで、テキスト読み上げの選択肢はありましたが、機械的な音声が多かったです。しかし、ElevenLabsの技術を使えば、数秒で全く新しい音声をデザインできます。「ダンジョンズ&ドラゴンズ」のようなゲームのキャラクターボイスを作成する場合、キャラクターの背景や特徴をプロンプトとして入力することで、ElevenLabsを使ってすぐに適切な音声を生成できます。これは素晴らしい体験です!

この新しいツールは、ゲームのストーリーを豊かにするだけでなく、インディーゲーム開発者にも柔軟性を与えます。

ElevenLabsが公開した機能は、プロンプトが詳細であればあるほど、ニーズに合った音声生成がされることを示しています。年齢、アクセント、性別、トーン、ピッチなどを記述したり、オーガ、エルフ、エイリアンなどの架空のキャラクターを使用してみましょう。

「少しかすれた、落ち着いた英国紳士の声で、プロフェッショナルでリラックスしていて、少し威厳のある声」という説明だけで、これらの特徴を備えた音声をすぐに生成できます。

音声プロンプト:「小さな声で話す恐ろしい魔女」

音声プロンプト:「巨大な雪だるま、低い声」

  

特定のキャラクターボイスが必要なクリエイターにとって、音声デザイン機能は大きな福音となるでしょう。この音声デザイン機能とAI動画生成ツールを組み合わせることで、映画専攻の学生などのクリエイターは、同じプロジェクト内でキャラクターの作成、シーンの設定、会話の作成を行い、より多くの創作の自由を得ることができます。公式によると、この音声デザイン機能のAPIは1週間以内に公開される予定です。

公式が提供する音声デザインプロンプトガイドライン

音声デザインの種類

種類説明プロンプト例
リアルな音声デザイン年齢、アクセント/国籍、性別、トーン、ピッチ、イントネーション、速度、感情を指定して、自然でリアルな音声を生成します。- 「若いインド人女性、優しく高い声。ゆっくりと穏やかに話す。」

- 「高齢の英国人男性、かすれた低い声。プロフェッショナルでリラックスしていて自信に満ちている。」

- 「中年オーストラリア人女性、温かく低い声。仕事中、速く話し、機嫌が良い。」

キャラクターボイスデザインよりシンプルなプロンプトで、クリエイティブなキャラクターに独特の音声を生成します。- 「巨大で邪悪なオーガ、トロール」

- 「活発な小さなキチキチ鳴くネズミ」

- 「怒っている老海賊、大声で叫ぶ」

その他、妖精、吸血鬼、エルフ、トロール、狼男、幽霊、エイリアン、巨人、魔女、魔法使い、ゾンビ、悪魔、デーモン、海賊、エルフ、オーガ、オーク、騎士、武士、バンシー、雪だるま、ドルイド、ロボット、妖精、サル、モンスター、ドラキュラなどを制作しました。

音声属性

属性重要性選択肢
年齢非常に重要若者、ティーンエイジャー、大人、中年、高齢者など…
アクセント/国籍非常に重要英国、インド、ポーランド、アメリカなど…
性別非常に重要男性、女性、中性
声質不要かすれた、柔らかい、温かい、耳障りななど…
ピッチ不要低い、深い、高い、キチキチ鳴るなど…
イントネーション不要会話風、プロフェッショナル、企業風、都会風、ファッショナブルなど…
速度不要速い、機敏な、遅い、リラックスしたなど…
感情/伝えたいこと不要怒り、平静、恐怖、喜び、自信、ささやき、叫びなど…

公式ウェブサイト:https://elevenlabs.io/voice-design

ポイント:

✨ テキストプロンプトで独自の音声を生成できるElevenLabsの音声デザインエンジンが登場!

🎮 新しいツールは、ロールプレイングゲームやインディーゲーム開発者に、より柔軟な音声デザインを提供します。

📽️ AI動画生成と組み合わせることで、クリエイターは同じプロジェクト内で簡単にキャラクターやシーンを作成できます。