近日,vivo AI Lab 發佈了其最新的端側多模態模型 ——BlueLM-2.5-3B。這款模型不僅小巧高效,更具備了理解圖形用戶界面(GUI)的能力,標誌着人工智能在處理文本和圖像方面邁出了重要一步。

BlueLM-2.5-3B 的獨特之處在於它可以靈活切換長短思考模式,並引入了思考預算控制機制,幫助 AI 更好地平衡思考的深度與效率。這使得該模型在多項文本和多模態評測任務中表現優異,尤其在理解和推理方面,有望超過許多同類產品。

vivo  001

在20餘項評測中,BlueLM-2.5-3B 顯示出了強大的文本處理能力,成功緩解了多模態模型常見的 “遺忘問題”。在長思考模式下,模型在推理類任務中,如數學和邏輯推理,的表現顯著優於其他同規模的模型。此外,其在多模態理解方面也表現不俗,能夠與更大規模的模型媲美,體現了它的強大。

不僅如此,BlueLM-2.5-3B 在理解 GUI 方面的表現尤爲突出,得益於對大量中文應用程序截屏數據的訓練。在這方面,它的得分超過了許多競爭對手,展示了 vivo 在人工智能領域的實力。

爲了支撐如此出色的表現,BlueLM-2.5-3B 採用了精巧的模型結構,參數量僅爲2.9B,且訓練和推理成本相對較低。通過優化的數據利用策略和高效的訓練流程,該模型在數據利用效率上有了顯著提升,爲 AI 的普及和應用打下了堅實的基礎。

BlueLM-2.5-3B 的發佈不僅爲用戶帶來了更加智能的應用體驗,也爲人工智能技術的進步增添了新的動力。