6月6日,面壁智能正式推出其最新力作——MiniCPM4.0系列模型,這一系列被譽爲“有史以來最具想象力的小鋼炮”,不僅在端側性能上實現了飛躍,更在技術創新上樹立了新的標杆。
MiniCPM4.0系列包含兩款重量級產品:一款是8B閃電稀疏版,以其創新稀疏架構掀起高效風暴;另一款則是僅0.5B的輕巧靈動版,被譽爲“最強小小鋼炮”。這兩款模型在速度、效能、性能及落地應用上均展現出卓越表現。
在速度方面,MiniCPM4.0實現了極限情況下220倍、常規5倍的速度提升,這一突破得益於系統級稀疏創新的層層加速。通過高效雙頻換擋技術,模型能夠根據文本長度自動切換稀疏與稠密注意力機制,確保長文本處理快速且高效,同時大幅減少端側存儲需求,相較於同類模型Qwen3-8B,僅需1/4的緩存存儲空間。
效能上,MiniCPM4.0貢獻了行業首例全開源的系統級上下文稀疏化高效創新,以5%的極高稀疏度實現極限加速,並融合自研創新技術,從架構層、系統層、推理層到數據層進行全面優化,真正做到系統級軟硬件稀疏化高效落地。
性能方面,MiniCPM4.0延續了“以小博大”的傳統,0.5B版本僅以2.7%的訓練開銷便達到了一半參數、性能翻倍的效果;而8B稀疏版則以22%的訓練開銷對標並超越Qwen3及Gemma312B,鞏固了其在端側領域的領先地位。
落地應用上,MiniCPM4.0展現出強悍的實力。通過自研CPM.cu極速端側推理框架,結合投機採樣創新、模型壓縮量化創新及端側部署框架創新,實現了模型瘦身90%的同時極致提升速度,確保端側推理從天生到終生的絲滑體驗。
目前,該模型已成功適配Intel、高通、MTK、華爲昇騰等主流芯片,並在多個開源框架上實現部署,進一步拓展了其應用潛力。
模型合集:
https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d
Github:
https://github.com/openbmb/minicpm