
複雑なスマートエージェントタスクにおける文脈拡張のボトルネックに対応するために、M3は独自に開発されたスパースアテンションアーキテクチャ(MSA)を下部に採用しており、従来の方法よりも正確なKVブロック分割とオペレータレイヤーの最適化が可能になりました。計算速度は同種のオープンソースソリューションに比べて4倍以上向上しています。1Mの文脈において、1トークンあたりの計算量は前世代モデルの1/10にまで低下し、予備入力とデコードフェーズでそれぞれ9倍と15倍の高速化が実現されました。

ネイティブな1兆以上のデータポイントを含む混合トレーニングにより、M3の意味空間は非常に融合されており、SWE-Bench Proなどのソフトウェアエンジニアリングやマルチモーダルの権威ある評価でGPT-5.5やGemini3.1Proを上回りました。極限的なタスクの実験では、M3は非常に強い長期スレッドの自律的計画能力を示しました。12時間かけてICLRのトップ論文の実験を自主的に再現し、参照コードなしで連続して24時間を稼働させ、約2,000回のツール呼び出しを行い、Hopperアーキテクチャ上のFP8行列乗算ハードウェア利用率を7.6%から71.3%に引き上げました。また、オープンなPostTrainBenchでモデルを自主的にスケジュールし、「データ-トレーニング-反復」の全プロセスを完了しました。
M3のリリースに伴い、長期間かつ複雑な協力を専門とするMiniMax Codeスマートエージェント製品、および非常に競争力のある価格のToken PlanおよびAPIサービスも同時にリリースされ、10日以内にモデルの重みをオープンソース化するという約束をしています。MiniMax M3の登場は、先端的なマルチモーダルと長文脈技術が海外の非オープンソースモデルによって独占されていた状況を打ち破り、すべての要素をオープンソース化することで、国内の開発者エコシステムのコストパフォーマンスの境界を再構築しました。
