AIbase ニュース 中国時間の最新情報によると、国内のAIユニコーン企業であるMiniMaxが次世代の大規模モデル「M3」を近日中にリリースする予定です。MiniMax AIエンジニアリング責任者のSkyler Miao氏は先日、ソーシャルメディアで予告を発表し、「Something BIG is coming!(何か大きなことが迫っています!)」と述べ、業界から広く注目を集めています。

image.png

M3のコアアーキテクチャの革新:スパースアテンション機構

明らかにされた情報によると、M3は新たなスパースアテンション(Sparse Attention)アーキテクチャを採用しています。Index Branchによる高速なインデックス付けと、Sparse Branchによる正確な計算を組み合わせることで、超長文脈処理における計算のボトルネックを効果的に解決しています。

従来のTransformerは、百万トークンレベルの文脈を処理する際、計算量がシーケンスの長さに平方級に増加します。一方で、M3のスパース設計により、このコストを大幅に削減でき、高性能を維持しながら著しく効率が向上します。これにより、長文理解や長对话、多ドキュメント分析などの応用シーンにおいて強力なサポートが可能になります。

実測性能はM2を大幅に上回る

前世代のM2(1Mトークンの文脈をサポート)と比較して、M3は重要な指標において画期的な向上を遂げました:

  • Prefill段階の速度が9.7倍向上
  • Decoding段階の速度が15.6倍向上

これは実際に運用する際に、M3が極めて低い演算コストで超長文脈を効率的に処理でき、推論コストを顕著に低下させ、より複雑なAIアプリケーションの可能性を開くことを意味しています。

業界への意義:長文脈時代の効率の新基準

MiniMaxが今回のM3の予告を発表したことで、国内のAI企業がアーキテクチャのイノベーションにおいて競争力を備えていることが改めて示されました。スパースアテンションなどの技術の進展により、大規模モデルは「パラメータの規模競争」から「効率性と実用性の競争」へと転じる可能性があります。これにより、企業向けの実装や消費者向けのアプリケーションにおいて、より手頃で効率的な体験がもたらされるでしょう。

現在、MiniMaxはM3の具体的なリリース時期や完全なパラメータ規模についてはまだ公表していませんが、エンジニアリング責任者の予告と性能データを見れば、このモデルは長文脈処理分野での有力な競合となることが期待されます。AIbaseはMiniMax M3の今後の動向を継続して注視し、最新情報をすぐにご提供いたします。