テキスト、画像、動画に続いて、音楽が生成AIが制覇しようとしている次のピークとなっています。The Informationによると、OpenAIは秘密裏に新しい生成型音楽ツールの開発を進めています。このツールは、テキストの説明や音声の断片に基づいて、感情とリズムに合ったオリジナルのBGMを自動生成できます。短いビデオに一瞬で雰囲気のある背景音楽を追加したり、ボーカルの歌唱にスマートにギター伴奏を生成したりするなど、この技術はコンテンツクリエイターの音声作業フローを劇的に変えることが期待されています。

モデルの専門性と音楽表現力を向上させるために、OpenAIは世界トップクラスの音楽学府であるジュリアード音楽院と提携しています。音楽専門の学生に多数の楽譜を詳細にラベリングしてもらい、チームは高品質なトレーニングデータセットを構築しています。これにより、AIは「曲を作成する」だけでなく、和声構造、曲式の論理、感情表現を理解できるようになります。この専門的な音楽知識の深く組み込まれた取り組みは、OpenAIが初期の実験的音楽モデル(ChatGPTよりも前に行われたプロジェクト)から、より実用的で芸術的な生成システムへの転換を示しています。

音楽

現在、このツールの公開形態についてはまだ秘匿されています。これは単独製品としてリリースされる可能性もありますし、ChatGPTや動画生成モデルSoraに深く統合される可能性もあります。「テキストから動画を生成+AIによる自動BGMの作成」というエンド・トゥ・エンドの創作体験が実現されるかもしれません。具体的なリリース日は未定ですが、その技術的方向性はマルチモーダルなコンテンツ生産の完結に向かっていることが明確です。

OpenAIは孤立していません。グーグルやSunoなどの企業もAI音楽生成分野での進出を加速しており、競争はますます激しくなっています。しかし、大規模なモデルアーキテクチャ、マルチモーダルの整合性、エコシステムの統合という強みを持つOpenAIは、専門性と使いやすさの間で重要なバランスを取る可能性があります。動画ブロガー、独立音楽人、映画制作チームにとって、「悲しみの雨の夜」や「熱血な追いかけっこ」のような表現を理解し、それに基づいてBGMを作成できるAIアシスタントは、音楽制作の技術的ハードルや障壁を実際に打破するかもしれません。

AIが単なるメロディーの模倣ではなく、「音楽の感情言語」を理解し始めると、クリエイターたちのための新しい時代が静かに幕を開けているかもしれません。