人工知能の継続的な発展の中で、最近登場した新モデル「MiniCPM-V4.0」が注目を集めています。このモデルは、MiniCPM-Vシリーズの最新バージョンで、パラメータ数は4.1億個です。SigLIP2-400M と MiniCPM4-3B をもとに構築されています。以前のバージョンと比べて、MiniCPM-V4.0は単一画像、複数画像、動画の理解において優れた性能を発揮し、効率性も大幅に向上しています。

image.png

MiniCPM-V4.0は強力な視覚能力に自信を持っています。多くの評価基準において、OpenCompassでの総合評価で平均得点69.0を記録し、GPT-4.1-mini-20250414、MiniCPM-V2.6(8.1億パラメータ、得点65.2)、Qwen2.5-VL-3B-Instruct(3.8億パラメータ、得点64.5)を上回りました。多画像理解和動画理解の分野でも良好な性能を示しています。

モバイルデバイス向けの設計は、MiniCPM-V4.0の大きな特徴の一つです。このモデルはiPhone16Pro Maxでスムーズに動作し、初めての応答遅延は2秒未満で、デコード速度は毎秒17トークン以上であり、過熱の問題もありません。高並列リクエスト下でも優れたスループットを示します。

より多くのユーザーが簡単に使い始められるように、MiniCPM-V4.0はさまざまな使用方法を提供しており、llama.cpp、Ollama、vLLMなどのプラットフォームとの互換性があります。さらに、ユーザーへのサービス向上のために、開発チームはiPhoneやiPadで動作するiOSアプリをオープンソース化し、ユーザーが使いやすくするためのサポートを行っています。それに伴うCookbookには詳細な使用ガイドと実用的な例が含まれており、操作をさらに簡略化しています。

プロジェクト: https://huggingface.co/openbmb/MiniCPM-V-4

ポイント:

🌟 OpenCompassの評価でMiniCPM-V4.0は69.0のスコアを獲得し、多数の同様のモデルを上回っています。

📱 このモデルはモバイルデバイス向けに設計されており、応答が早く、過熱の問題はありません。

📚 オープンソースのiOSアプリと詳細な使用ガイドにより、ユーザーはより簡単に使い始めることができます。