最近、vivo AI Labは最新のエッジ側マルチモーダルモデルであるBlueLM-2.5-3Bを発表しました。このモデルはコンパクトで効率的であり、グラフィカルユーザーインターフェース(GUI)を理解する能力も備えています。これにより、人工知能がテキストと画像の処理において重要な一歩を踏み出しました。

BlueLM-2.5-3Bの特徴は、長時間および短時間の思考モードを柔軟に切り替えることができ、また思考予算制御メカニズムを導入している点です。これはAIが思考の深さと効率のバランスをよりよく取るのを助けます。このため、このモデルはテキストおよびマルチモーダルの評価タスクにおいて優れた性能を示しており、特に理解と推論において多くの競合製品を上回る可能性があります。

vivo 001

20以上の評価で、BlueLM-2.5-3Bは強力なテキスト処理能力を示し、マルチモーダルモデルで一般的な「忘れの問題」を成功裏に緩和しました。長時間の思考モードでは、数学や論理的な推論などの推論タスクにおいて、他の同規模のモデルよりも顕著に優れた性能を発揮します。さらに、マルチモーダル理解においても優れた性能を示し、より大規模なモデルと同等の性能を発揮しています。

さらに、BlueLM-2.5-3BはGUIの理解において特に突出しており、大量の中国語アプリケーションスクリーンショットデータを訓練した結果です。この面では、多くの競合製品を上回るスコアを記録し、vivoが人工知能分野での実力を示しています。

このような優れた性能を支えるために、BlueLM-2.5-3Bは巧みなモデル構造を採用しており、パラメータ数はわずか2.9Bであり、トレーニングおよび推論コストは相対的に低くなっています。最適化されたデータ利用戦略と効率的なトレーニングプロセスを通じて、このモデルはデータ利用効率を大幅に向上させ、AIの普及と応用に堅固な基盤を築いています。

BlueLM-2.5-3Bのリリースは、ユーザーにさらにスマートなアプリケーション体験を提供するとともに、人工知能技術の進歩に新たな力添えとなります。