小米正式進軍高性能開源大模型賽道。近日,公司發佈了全新基礎語言模型 MiMo-V2-Flash,並同步以 MIT協議全面開源 模型權重與推理代碼。該模型以“超高速、高效率”爲核心賣點,在推理、代碼生成與智能體任務中表現尤爲突出,實測響應速度甚至超越當前熱門的豆包、DeepSeek和元寶等國產模型,引發開發者社區廣泛關注。

image.png

MiMo-V2-Flash採用稀疏激活架構,總參數量高達3090億,但每次推理僅激活150億參數,在保持強大能力的同時顯著降低計算開銷。這一設計使其在多項公開基準測試中穩居開源模型第一梯隊,兼顧性能與成本效率。

網友實測反饋顯示,MiMo-V2-Flash的響應速度“快得令人意外”——在相同硬件環境下,其生成延遲明顯低於DeepSeek等競品,尤其在多輪對話與複雜邏輯推理場景中優勢更爲顯著。有開發者評價:“不是快一點,是快一個量級。”

小米MiMo-V2-Flash大模型發佈 回答速度出乎網友意料 比DeepSeek快

爲加速生態落地,小米同步推出極具競爭力的API定價:每百萬輸入Token僅0.1美元,輸出Token0.3美元,並提供限時免費試用。這一價格遠低於主流商業模型,爲中小企業和獨立開發者提供了高性價比的替代方案。

值得注意的是,MiMo-V2-Flash並非僅面向開發者,其通用能力也適配日常AI助手場景,可無縫集成至手機、智能家居、車載系統等小米“人車家全生態”終端。就在模型發佈當天,小米將舉辦 人車家全生態合作伙伴大會,預計將進一步披露MiMo-V2-Flash在端雲協同、設備端部署及多模態擴展等方面的深度應用規劃。

小米MiMo-V2-Flash大模型發佈 回答速度出乎網友意料 比DeepSeek快

在國產大模型競爭白熱化的當下,小米選擇以“高性能+真開源+低門檻”組合拳切入,不僅彰顯其AI戰略的長期決心,更可能重塑開源模型的性能與成本預期。當3090億參數的巨模型也能“快如閃電”,大模型的競技場,又多了一位不容忽視的重量級玩家。