大規模モデルの競争は再び波紋を広げている。AIスタートアップ企業のMiniMaxは先日、新たなエースモデルであるM3を正式に発表した。技術報告書に掲載された各ベンチマークテストの結果を見ると、このモデルの性能は驚くべきものである:認知度の高いソフトウェアエンジニアリングシナリオに近いテストでは59%という優れた成績を収めた。これはGPT-5.5を上回り、Opus4.7にも迫るほどだ。さらに、百万単位のコンテキスト処理能力とネイティブなマルチモーダル機能も備えている。しかし、強力な技術指標とは対照的に、モデルの発表後には開発者コミュニティが激しく反応し、中国語のコミュニティでは批判の声が殺到している。

業界内での疑問を引き起こした最初の核心的なポイントは、「裏技」に満ちた評価データである。技術詳細によると、M3はコード関連のテストで、競合他社のClaude Codeを評価のフレームワークとして利用した。現在の業界では、現成のツールチェーンを使ってエージェント(Agent)の評価を行うことは一般的だが、MiniMaxは他人のフレームワークを使って自分自身の能力を測定し、高得点を得てその相手と並んで宣伝することをやった。この行動は多くのプログラマーから「正直ではない」と批判されている。ユーザーにとって、最終的な好成績がどれだけモデルの本来の能力であり、どれだけがフレームワークの効果によるものか、見分けがつかない。

image.png

次に、オープンソースへの「誠意」の問題も、オープンソースコミュニティに混乱をもたらしている。他のメーカーがオープンソースモデルを発表する際には、モデルサイズやモデルの重み(パラメータ)を公開するが、MiniMaxは今回のM3発表においては、モデルサイズや重みを公開せず、発表後10日後にオープンソース化するとのみ表明し、現在はAPI経由でのみアクセスできる。オープンソースコミュニティの核となる価値は「再現性と検証可能性」であるが、このような開示しないオープンソースの宣伝は、商業的な論理では理解可能だが、実務的で正直な開発者層にとっては深刻な損害を与える。

image.png

最も重度の旧ユーザーにとって「裏切り」に感じるのは、料金プラン(Coding Plan)の無予告な変更である。以前は、MiniMaxはリクエスト数で制限を設け、月間トークン量の上限を設定しなかったため、「量が多いので安心」として知られていた。しかしM3の発表とともに、新しいトークンプランが同時に導入され、規則が総量課金に変更された。公式側はPlusプランのトークン使用量が非常にコストパフォーマンスに優れていると主張しているが、百万単位のコンテキストを扱うような重度の使用状況では、一度の呼び出しで大量のトークンを消費するため、新規則によりプランの上限が迅速に尽きてしまう。これにより、旧ユーザーからの集団的な不満が噴出している。

これらの運用上の議論を除けば、M3の下部構造における革新は依然として目立つ。自社で開発したMSA(MiniMax Sparse Attention)というスパース注目機構を開発し、KV(キー・バリュー)を高精度にブロック化し、スパース化することで、従来のTransformerが長文処理において計算量が急増するという魔咒を突破した。また、基本的な演算子レベルで、新たな計算集約方式を初めて採用し、メモリアクセスがより連続的になり、オープンソースのFlash-Sparse-Attentionよりも4倍以上速くなっている。これにより、M3は百万単位のコンテキストでの前方伝播およびデコード速度がそれぞれ9倍と15倍に向上し、1トークンあたりの計算量は前世代の半分以下にまで減少した。

純粋な技術的な視点から見れば、M3は長文処理、マルチモーダルおよびエージェントの能力のバランスが国内のメーカーの中で突出している。しかし、今回の発表および運用方法に関する一連の「不思議な行動」によって、技術的な光りはコミュニティの議論に埋もれてしまった。市場がM3に対して注目し、感情的に反応していることから、開発者たちはこの製品に期待を持っていることがわかる。そしてMiniMaxがコミュニティの信頼を取り戻せるかどうかの答えは、おそらく10日後、モデルの重みが正式に公開され、独立した評価を受けた後で明らかになるだろう。