MiniMax は近日、正式に MiniMax Music2.5 をリリースしました。今回のアップグレードの核心的な目的は、AI音楽における「制御性」と「現実感」の長期的な課題を打ち破ることで、技術の進化によりグラミー賞級のプロの創作が手軽に可能になります。

image.png

前バージョンと比べて、Music2.5は2つの主要な面で飛躍的な進歩を遂げています:

  • 段落レベルの強力なコントロール(Direct the Detail): モデルは全段落のタグ制御を開放し、前奏(Intro)、ブリッジ(Bridge)、サビ(Hook)など14種類の構造変異を正確にサポートします。クリエイターはプロの編曲家のように、タグを通じて楽器の配置や感情の張力を正確に調整することができます。運任せに生成するのではなく、確実に制御できます。

  • 物理レベルの高保真(Define the Real): システマティックな最適化により、Music2.5は連続して滑らかなトーン、自然な起伏を持つ震え、複数の空洞共鳴の切り替えを実現しました。人声の生命感を大幅に強化しています。さらに、モデルは100以上の楽器の音色ライブラリを拡充し、スタイルに応じて自動的にミキシング戦略を調整することができ、密集したシーンでも人声とバックトラックが明確に区別されます。

華語市場に合わせて、Music2.5は深くカスタマイズされ、C-PopとC-Rapのメロディックロジックが大幅に最適化され、発音の問題や濁音の問題が大きく減少しました。中英語混在のシナリオでもスムーズに接続可能です。現在、MiniMax Music2.5はその公式ウェブサイトおよびAPIプラットフォームで同時にリリースされています。

製品体験:

minimaxi.com/audio/music

APIインターフェース:

platform.minimaxi.com/docs/api-reference/music-generation

注目ポイント:

  • 🎵 全段落のコントロール: 14種類の音楽構造タグをサポートし、AI創作を「ランダム生成」から「正確な指揮」に変えます。

  • 🎤 本格的なボーカルの質感: 滑らかなトーンと震えの表現を備えており、男性と女性のデュエットにおいて自然な協調性とハーモニーの階層を実現します。

  • 🎹 プロレベルのミキシング: 数百種類の楽器の音色が内蔵されており、スタイルに応じた自動適応ミキシング能力を持ち、スタジオレベルの音声配信を実現します。

  • 🇨🇳 華語の深い最適化: 中文の発音や華語ポップのトレンドをシステムレベルで向上させ、あらゆるポップやラップのシナリオに適応します。