「あなたの声はインターネット上で裸で走っています。」これは過剰な心配ではなく、現在配音界で起きている現実です。アマゾンブランドドキュメンタリー『セレナス・プロジェクト』のナレーションが放送されたとき、穆雪婷は半分ほど戸惑いました。「それは明らかに自分の声だったが、一度もその台詞を録音したことはありませんでした。」彼女は微博で助けを求め、ネットユーザーが比較した結果、一致して「あなたです」と答えました。誰も彼女に著作権料を支払わず、事前に連絡もありませんでした。声はまるで見えない手によって「引き剥がされ」、直接映画に組み込まれてしまいました。穆雪婷の質問により、AI音声クローンの灰色産業が一気にスポットライトの下にさらされました。
技術のハードルは非常に低く「信じられないほど」です。OpenAIの最新音声エンジンでは15秒のクリーン音声だけで、ほぼ区別がつかない「デジタル声帯」を複製できます。市販の数十ドルの商用ソフトウェアでは、「感情+アクセント」のパッケージがサポートされており、ワンクリックで広告レベルのナレーションが生成可能です。2年前にはスタジオとプロのミキシングが必要だった業務は、今やアップロード-ダウンロードのラインに圧縮されています。
業界の温度は急激に低下しています。IDCのデータによると、中国のAI音声市場の規模は2024年に1493億元になると予測され、年平均成長率は28%です。一方で、音声プラットフォームの求人ページでは「本物の声優」のポジション数は40%近く減少しています。喜馬拉雅で以前は激しく募集していた「声優ブロガー」は、今や多くの紹介文が「AI音声後処理」に変更されています。下層の声優は、顧客が予算を決める際の最初の言葉が「どんな感情を表現できるか」から「AIに何ができるか」に変わっていることに気づきました。
「超高精度効果」が新たな課題となっています。AIの声は非常にクリーンで、「ん、あ、息」などの要素がないため、鏡のように反光しており、人間のナレーションに必要な「毛孔感」がありません。しかし市場はお金をかけて判断しています。15秒のクリーン音声+著作権料ゼロで、いくら「完璧すぎる違和感」を無視しても十分に魅力的なのです。

モーガン・フリーマンはすでに「声を守る」訴訟を開始し、ある広告が彼の低音の声をAIでクローンしていることを控訴しています。穆雪婷の出来事後に、国内の多くの声優スタジオでは声を「音声指紋」で登録するようになりました。類似度が85%以上になる商用のセグメントが検出されると、自動的に弁護士の書簡が送付されます。技術的な対抗も加速しています。ブロックチェーンによる証拠保存、声紋ウォーターマーク、敵対的ノイズがクリーン音声ファイルに埋め込まれており、声に「見えない鍵」をかけようとしています。
しかし、洪水はまだ増加しています。IDCの予測によると、2026年までにAI音声は中国の声優市場の60%以上を占める見込みです。真の人間の声優にとって残された空間は、おそらく高価格な感情の領域だけです。ドキュメンタリー、芸術映画、ゲームキャラクターの声優など、そこでは「完璧ではない息使い」が必要とされています。
穆雪婷は微博に書き込みました。「もし今日私たちが声を上げなければ、明日本当に声がなくなるかもしれません。」コメント欄では、声優の新米、朗読のブロガー、広告ナレーターが一緒に共有しました。これは彼らが初めて自分の声に対して「本当の叫び」を上げたのです。
