近日,上海的 AI 獨角獸公司 MiniMax 正式推出了全球首個開源大規模混合架構推理模型 ——MiniMax-M1。該模型一經推出,便迅速躋身權威評測榜單,成爲全球開源模型的第二名,僅次於近期發佈的 DeepSeek-R1-0528。這一里程碑式的成就讓 MiniMax 創始人兼 CEO 閆俊傑在社交媒體上感慨:“第一次感覺到大山不是不能翻越。”
MiniMax-M1的亮相不僅令人矚目,其在技術細節上的表現更是出色。該模型在長文本處理和工具調用等方面顯示出強大的優勢,支持高達100萬 token 的上下文輸入能力,足以一次性處理整部《三體》英文原著。這一性能是 DeepSeek 同類模型的八倍,甚至可以與谷歌最新的閉源模型 Gemini2.5Pro 相媲美。
更令人驚歎的是,MiniMax 在強化學習階段的研發投入僅爲53.5萬美元,遠低於業內普遍的千萬級研發成本,展現了其卓越的研發效率和產品化能力。在 M1發佈後的短短四個工作日內,MiniMax 便接連推出了多款創新產品,包括視頻生成模型 Hailuo02、通用智能體 MiniMax Agent、視頻創作智能體 Hailuo Video Agent 及音色設計工具 Voice Design,保持着令人矚目的 “日更” 節奏。
作爲一家紮根於上海徐匯的 AI 企業,MiniMax 自2022年底 ChatGPT 引發全球熱潮之前,就已開始佈局通用人工智能 (AGI) 領域,並果斷摒棄了當時流行的大模型稠密架構和傳統注意力機制。面對全球大模型研發企業的普遍收縮,MiniMax 堅決堅持基礎模型研發的戰略選擇,最終實現了這一技術突破。
可以說,MiniMax-M1的發佈不僅是技術上的一大步,也是對行業未來的一次有力推動,或許將重新定義開源 AI 模型的發展方向。