小米開源3090億參數MiMo-V2-Flash大模型，推理速度碾壓主流競品，API低至0.1美元/百萬Token

小米正式進軍高性能開源大模型賽道。近日，公司發佈了全新基礎語言模型 MiMo-V2-Flash，並同步以 MIT協議全面開源模型權重與推理代碼。該模型以“超高速、高效率”爲核心賣點，在推理、代碼生成與智能體任務中表現尤爲突出，實測響應速度甚至超越當前熱門的豆包、DeepSeek和元寶等國產模型，引發開發者社區廣泛關注。

MiMo-V2-Flash採用稀疏激活架構，總參數量高達3090億，但每次推理僅激活150億參數，在保持強大能力的同時顯著降低計算開銷。這一設計使其在多項公開基準測試中穩居開源模型第一梯隊，兼顧性能與成本效率。

網友實測反饋顯示，MiMo-V2-Flash的響應速度“快得令人意外”——在相同硬件環境下，其生成延遲明顯低於DeepSeek等競品，尤其在多輪對話與複雜邏輯推理場景中優勢更爲顯著。有開發者評價:“不是快一點，是快一個量級。”

小米MiMo-V2-Flash大模型發佈回答速度出乎網友意料比DeepSeek快

爲加速生態落地，小米同步推出極具競爭力的API定價:每百萬輸入Token僅0.1美元，輸出Token0.3美元，並提供限時免費試用。這一價格遠低於主流商業模型，爲中小企業和獨立開發者提供了高性價比的替代方案。

值得注意的是，MiMo-V2-Flash並非僅面向開發者，其通用能力也適配日常AI助手場景，可無縫集成至手機、智能家居、車載系統等小米“人車家全生態”終端。就在模型發佈當天，小米將舉辦人車家全生態合作伙伴大會，預計將進一步披露MiMo-V2-Flash在端雲協同、設備端部署及多模態擴展等方面的深度應用規劃。

小米MiMo-V2-Flash大模型發佈回答速度出乎網友意料比DeepSeek快

在國產大模型競爭白熱化的當下，小米選擇以“高性能+真開源+低門檻”組合拳切入，不僅彰顯其AI戰略的長期決心，更可能重塑開源模型的性能與成本預期。當3090億參數的巨模型也能“快如閃電”，大模型的競技場，又多了一位不容忽視的重量級玩家。

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

MiniMax稀宇科技於2026年6月1日發佈新一代前沿大模型M3，這是國內首個集成頂尖編程、1M超長上下文及原生多模態能力的開源模型，對標海外閉源旗艦。針對複雜智能體任務的上下文擴展瓶頸，M3自主研發稀疏注意力架構（MSA），實現更精確的KV分塊與算子層優化，計算速度較同類開源方案提升4倍以上，在1M上下文下每Token計算量顯著降低。

小米開源3090億參數MiMo-V2-Flash大模型，推理速度碾壓主流競品，API低至0.1美元/百萬Token

相關推薦

報道稱DeepSeek 完成 A 輪 510 億元融資，騰訊、京東等巨頭參與

巴西AI黑馬Rio 3. 5 翻車：被指套殼縫合兩款國產大模型

谷歌發佈Gemma 4，E2B架構讓手機本地跑AI現質變

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

小米宣佈 MiMo-V2-Pro/Omni 將於2026年6月下線，全面切換 V2.5系列

小米開源3090億參數MiMo-V2-Flash大模型，推理速度碾壓主流競品，API低至0.1美元/百萬Token

相關推薦

報道稱DeepSeek 完成 A 輪 510 億元融資，騰訊、京東等巨頭參與

​巴西AI黑馬Rio 3. 5 翻車：被指套殼縫合兩款國產大模型

谷歌發佈Gemma 4，E2B架構讓手機本地跑AI現質變

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

小米宣佈 MiMo-V2-Pro/Omni 將於2026年6月下線，全面切換 V2.5系列

巴西AI黑馬Rio 3. 5 翻車：被指套殼縫合兩款國產大模型