9月12日、MiniMaxは新世代の音楽生成モデル「Music1.5」をリリースしました。このモデルはAI音楽創作の新たな突破を示し、「一人でバンド」という新しい時代を開きました。Music1.5は音楽の生成時間を4分にまで伸ばし、4つの新たな突破を達成しています:強力なコントロール性、自然で豊かなボーカル、豊かで階層的な編曲、そして明確な曲構成です。
Music1.5は最大4分間の音楽制作をサポートしており、完成品として出力されるため、もはやデモスケッチにとどまりません。このモデルは、曲のスタイル、感情、シーンをカスタマイズし、強力なコントロールが可能です。ユーザーが単純な自然言語の記述を提示するだけで、Music1.5は非常に完成度の高い作品を提供します。高級モードでは、ユーザーが曲のさまざまなセクション、例えばイントロ、バーチ、サビなどに対して具体的な歌詞の編成を行うこともできます。Music1.5は「16のスタイル×11の感情×10のシーン」といったカスタマイズ可能な音楽特徴をサポートし、異なる声質や歌唱スタイルの音色を生成できます。音質はよりクリアで現実的であり、自然で満たされており、滑らかなトーンで断層がないため、曲の感情表現力が大幅に豊かになります。
編曲に関しては、Music1.5は楽器を細粒度でモデリングし、編曲が豊かで楽器の階層が明確、演奏テクニックの変化が豊富になります。また、中国のマイナーや民族楽器の生成もサポートしており、『江南煙雨詩』では多くの中国伝統民楽が取り入れられています。さらに、Music1.5はイントロ/バーチ/サビのセクション間に明確な違いを持ち、サビの爆発的なポイントが明確で、エンディングが自然に収束し、本格的な「物語レベル」の聴覚体験を提供します。
これらの突破は、MiniMaxがテキスト、音声、視覚などのマルチモーダルな自社技術の蓄積によって成し遂げられました。Music1.5はテキストモデルの能力を利用して、テキストの説明に対してより強い理解力と制御力を備えています。これにより、曲のスタイル、感情の色調、適用シーンを全体的に制御することが可能になるだけでなく、ボーカルの特徴を細粒度で制御し、異なる声質を持つボーカルの音色を生成することもできます。
Music1.5は多様なシナリオに適しており、プロの音楽制作においてAIによる創造的インスピレーションの補助、映画、ゲーム、動画コンテンツ向けに迅速な背景音楽のカスタマイズ、バーチャルアイドル向けの楽曲とMVの制作、企業ブランド向けの専用オーディオコンテンツの生成などに活用されます。また、Music1.5はグローバル開発者向けにAPIを同時に提供し、世界最高のコストパフォーマンスを維持しています。アプリケーション、ツール、あるいは制作ワークフローに関わらず、簡単に接続でき、AIを「24時間体制の創作パートナー」として活用できます。
Music1.5のリリースは、音楽創作のハードルを下げ、聴覚の本質に戻し、「良い音楽」が自然に生まれるようにしました。このモデルは現在、世界中でリリースされており、ユーザーはminimaxi.com/audio/musicにアクセスしてすぐに体験し、自分の次のヒット曲を制作できます。