國內人工智能領域的知名科技公司稀宇科技 MiniMax,於今日正式宣佈開源其原生多模態旗艦模型 MiniMax M3。此前官方已提前向業界開放了該模型的權重,並同步發佈了極具技術含量的稀疏注意力機制論文,引發了開源社區的廣泛關注。

綜合性能榮登開源榜首
作爲 MiniMax 傾力打造的旗艦級模型,M3 擁有高達 428B 的總參數量,其中激活參數爲 23B。值得一提的是,該模型是行業內首個從底層訓練初期,就直接進行多模態混合訓練的開源大模型。
憑藉着卓越的技術架構,M3 在發佈後的短短兩週內,便在權威的全球綜合智能指數排行榜上斬獲了開源模型的第一名。針對發佈初期訪問量暴增導致的體驗延遲,官方已經將模型的輸出速度從最初的 30 TPS 優化提升至 80 TPS,未來還將繼續提速。
頂尖編碼與代碼交付能力
在多項高難度的編碼與智能體能力評測中,MiniMax M3 均展現出了行業頂尖的技術水準。它不僅具備自主拆解複雜任務的能力,還能熟練調用各類外部工具進行多步推理。
與傳統模型相比,M3 的代碼編寫能力實現了質的飛躍。官方表示其輸出的代碼旨在直接達到可交付的標準,而非“勉強能跑但仍需人工大量修改”的半成品,這將極大地解放開發者的生產力。
