在人工智能的持续发展中,最近一款新模型 MiniCPM-V4.0引起了广泛关注。该模型是 MiniCPM-V 系列的最新版本,具有4.1亿参数,基于 SigLIP2-400M 和 MiniCPM4-3B 进行构建。与之前的版本相比,MiniCPM-V4.0在单图、多图及视频理解方面表现出色,并且在效率上有了显著提升。
MiniCPM-V4.0以其强大的视觉能力而自豪。在众多评测基准中,该模型在 OpenCompass 的综合评估中取得了69.0的平均分,超越了 GPT-4.1-mini-20250414、MiniCPM-V2.6(8.1亿参数,得分65.2)和 Qwen2.5-VL-3B-Instruct(3.8亿参数,得分64.5)。在多图理解和视频理解领域,它也展现了良好的性能。
针对移动设备的设计是 MiniCPM-V4.0的一大亮点。该模型在 iPhone16Pro Max 上运行顺畅,首次响应延迟不到2秒,解码速度超过每秒17个 token,且没有发热问题。即便在高并发请求下,它也表现出优越的吞吐能力。
为了让更多用户轻松上手,MiniCPM-V4.0提供了多种使用方式,包括与多种平台兼容的工具,如 llama.cpp、Ollama、vLLM 等。为了更好地服务用户,开发团队还开源了一款可以在 iPhone 和 iPad 上运行的 iOS 应用,帮助用户轻松上手。配套的 Cookbook 也提供了详细的使用指南和实用示例,进一步简化了操作过程。
项目:https://huggingface.co/openbmb/MiniCPM-V-4
划重点:
🌟 MiniCPM-V4.0在 OpenCompass 评测中得分69.0,超越多款同类模型。
📱 该模型专为移动设备设计,响应快且无发热问题。
📚 开源 iOS 应用及详细使用指南,让用户更轻松上手。