シリコンクラウド(SiliconCloud)は、世界初のオープンソースの大規模ハイブリッドアテンション推論モデルである MiniMax-M1-80k (456B) を正式にリリースしました。この革新的なモデルは、ソフトウェアエンジニアリングや長文の文脈理解、ツールの使用など複雑なタスクに強力なサポートを提供し、現在のトップモデルである o3 や Claude4Opus と遜色ないパフォーマンスを実現しています。
MiniMax-M1-80k は最大128K の文脈長さをサポートしており、長文の処理に非常に便利です。特殊なニーズを持つユーザーには、バックエンドでの1M の長い文脈処理も可能です。このモデルの利用価格は、入力が100万 Tokens につき ¥4、出力が100万 Tokens につき ¥16 です。新規ユーザーは最初の利用時に14元の体験クレジットを受け取ることができます。
MiniMax-M1-80k モデルは MiniMax-Text-01 をベースに開発され、ハイブリッドエキスパートシステム(MoE)アーキテクチャと Lightning Attention メカニズムを使用しており、効率的な強化学習拡張フレームワークを備えています。この設計により、モデルは従来の数理推論タスクだけでなく、リアルなサンドボックスソフトウェア開発環境でも活躍します。そのため、長文の処理や深い思考が必要なタスクに最適です。
パフォーマンス面では、MiniMax のベンチマークテストによれば、MiniMax-M1-80k は10万 Tokens の生成時に DeepSeek R1 の25% の FLOPs 消費しかかからず、推論演算能力の効率的な拡張を実現しています。また、MiniMax-M1-80k は数学、プログラミング、ツールの使用、長文理解などの分野で、o3 などのトップモデルと同等の評価結果を達成しています。
シリコンクラウドは、開発者向けの一貫した大規模モデルクラウドサービスプラットフォームであり、優れたサービスを提供することを目指しています。MiniMax-M1-80k 以外にも、DeepSeek-R1-0528、Qwen3、GLM-4シリーズなど、多数の優れたモデルを提供しており、開発者の選択肢を大幅に広げています。特に、DeepSeek-R1 の蒸留版や他のいくつかのモデルは無料で利用でき、「Tokenの自由」を促進しています。
MiniMax-M1-80k の新機能を体験したい場合、ユーザーは SiliconCloud の公式ウェブサイトでオンライン体験や接続を行うことができます。これにより、ジェネレーティブAIの応用開発をさらに推進できます。
オンライン体験
https://cloud.siliconflow.cn/models
サードパーティアプリケーションへの接続ガイド
https://docs.siliconflow.cn/cn/usercases/