在人工智能的持續發展中,最近一款新模型 MiniCPM-V4.0引起了廣泛關注。該模型是 MiniCPM-V 系列的最新版本,具有4.1億參數,基於 SigLIP2-400M 和 MiniCPM4-3B 進行構建。與之前的版本相比,MiniCPM-V4.0在單圖、多圖及視頻理解方面表現出色,並且在效率上有了顯著提升。

image.png

MiniCPM-V4.0以其強大的視覺能力而自豪。在衆多評測基準中,該模型在 OpenCompass 的綜合評估中取得了69.0的平均分,超越了 GPT-4.1-mini-20250414、MiniCPM-V2.6(8.1億參數,得分65.2)和 Qwen2.5-VL-3B-Instruct(3.8億參數,得分64.5)。在多圖理解和視頻理解領域,它也展現了良好的性能。

針對移動設備的設計是 MiniCPM-V4.0的一大亮點。該模型在 iPhone16Pro Max 上運行順暢,首次響應延遲不到2秒,解碼速度超過每秒17個 token,且沒有發熱問題。即便在高併發請求下,它也表現出優越的吞吐能力。

爲了讓更多用戶輕鬆上手,MiniCPM-V4.0提供了多種使用方式,包括與多種平臺兼容的工具,如 llama.cpp、Ollama、vLLM 等。爲了更好地服務用戶,開發團隊還開源了一款可以在 iPhone 和 iPad 上運行的 iOS 應用,幫助用戶輕鬆上手。配套的 Cookbook 也提供了詳細的使用指南和實用示例,進一步簡化了操作過程。

項目:https://huggingface.co/openbmb/MiniCPM-V-4

劃重點:

🌟 MiniCPM-V4.0在 OpenCompass 評測中得分69.0,超越多款同類模型。  

📱 該模型專爲移動設備設計,響應快且無發熱問題。  

📚 開源 iOS 應用及詳細使用指南,讓用戶更輕鬆上手。