近日,MiniMax公司宣佈推出其全新模型MiniMax-M1,該模型作爲世界上首個開源的大規模混合架構推理模型,在面向生產力的複雜場景中展現出了卓越性能,成爲開源模型中的佼佼者。MiniMax-M1不僅超越了國內閉源模型,還接近了海外最領先模型的水平,同時保持着業內最高的性價比。
MiniMax-M1的一個顯著特點是支持高達100萬的上下文輸入,與閉源模型Google Gemini2.5Pro相當,是DeepSeek R1的8倍,並且能夠輸出長達8萬Token的推理結果。這一成就得益於MiniMax獨創的以閃電注意力機制爲主的混合架構,使得在處理長上下文輸入和深度推理時效率顯著提升。例如,在使用8萬Token進行深度推理時,MiniMax-M1僅需DeepSeek R1約30%的算力,從而在訓練和推理過程中都具有算力效率優勢。
此外,MiniMax還提出了更快的強化學習算法CISPO,通過裁剪重要性採樣權重來提升強化學習效率。在AIME的實驗中,CISPO算法的收斂性能比包括字節近期提出的DAPO在內的其他強化學習算法快了一倍,顯著優於DeepSeek早期使用的GRPO算法。這些技術創新使得MiniMax-M1的強化訓練過程異常高效,僅用了512塊H800三週的時間,租賃成本也大幅降低,比預期少了一個數量級。
在評測方面,MiniMax-M1在業內主流的17個評測集上均取得了優異成績。特別是在軟件工程、長上下文與工具使用等面向生產力的複雜場景中,MiniMax-M1展現出了顯著優勢。例如,在SWE-bench驗證基準上,MiniMax-M1-40k和MiniMax-M1-80k分別取得了55.6%和56.0%的成績,雖然略遜於DeepSeek-R1-0528的57.6%,但顯著超越了其他開源權重模型。同時,依託其百萬級上下文窗口,MiniMax-M1在長上下文理解任務中表現卓越,超越了所有開源權重模型,甚至在某些方面超越了OpenAI o3和Claude4Opus,全球排名第二。
值得一提的是,MiniMax-M1在代理工具使用場景(TAU-bench)中也同樣領跑所有開源權重模型,並戰勝了Gemini-2.5Pro。此外,MiniMax-M1-80k在大多數基準測試中始終優於MiniMax-M1-40k,這充分驗證了擴展測試時計算資源的有效性。
在價格方面,MiniMax-M1保持了業內最低的價格。在MiniMax APP和Web上,用戶可以不限量免費使用該模型,並通過官網以極具競爭力的價格購買API服務。這一舉措無疑將進一步推動MiniMax-M1在市場上的普及和應用。