國內大模型賽道迎來硬核技術突破。6月1日,稀宇科技正式發佈了新一代大語言模型——
在衡量大模型核心競爭力的多項權威評測中,MiniMax M3交出了極爲亮眼的成績單。在極具挑戰性的編程評測集 SWE-Bench Pro 上,M3取得了59.0%的優異得分,這一成績不僅超越了 GPT-5.5和 Gemini3.1Pro,更逼近了行業標杆 Claude3.5Opus(此處對應原文Opus4.7趨向);而在考驗 AI 智能體調度能力的 Claw-Eval 評測,以及考察多模態文檔解析能力的 OmniDocBench 測試中,M3均斬獲了行業最高分或超越了 Gemini3.1Pro。

M3能夠在性能飆升的同時保持高效運轉,核心得益於其底層架構的重大創新。該模型採用了全新的稀疏注意力架構 MSA(MiniMax Sparse Attention)。在這種底層邏輯的加持下,模型在處理100萬超長上下文時,每個 Token 的計算量竟然壓縮至上一代模型的二分之一十。這直接帶來了速度上的飛躍:在 Prefilling(預填充)階段,模型運行加速超過9倍;而在 Decoding(解碼生成)階段,加速更是超過15倍,大幅降低了算力開支。
作爲原生多模態模型,M3不僅能夠深度理解文本,還支持圖片、視頻的主動輸入,甚至能直接完成高難度的電腦桌面自動化操作。伴隨模型的發佈,MiniMax 同步升級了旗下的 AI 編程助手產品 MiniMax Code,並面向開發者推出了全新的 Token Plan 訂閱方案,共分爲 Plus(49元/月)、Max(119元/月)和 Ultra(469元/月)三檔,以滿足不同體量的開發需求。
目前,M3的 API 接口已正式對公衆開放使用。爲了吸引更多開發者卡位生態,官方還上線了限時福利,其512k上下文版本將開展爲期7天的限時5折優惠。此外,MiniMax 官方承諾,該模型的完整權重以及詳細的技術報告將在10天內面向全球開發者正式開源。這種“底牌全露”的開源底氣,無疑將進一步加速端側與應用層 AI 創新的爆發。
