小米大模型團隊宣佈開源最新一代多模態大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 與 SFT 兩個版本。
官方數據顯示,新版模型在學科推理、文檔理解、圖形界面定位及視頻理解四項核心能力上全面刷新紀錄,其中 MMMU 基準首次突破70分大關,ChartQA 升至94.4,ScreenSpot-v2達92.5,VideoMME 提升至70.8。
此番迭代通過優化強化學習穩定性與監督微調流程,使模型在內部 VLM Arena 評分從1093.9躍升至1131.2。
尤爲引人關注的是,用戶可在提問時通過“/no_think”指令自由切換“思考”與“非思考”模式:前者全程展示推理鏈條,控制成功率100%,後者直接生成答案,響應更快,成功率99.84%。
MiMo-VL-7B-RL-2508
推薦用戶在大多數情況下體驗使用該模型。
開源地址:https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL-2508
MiMo-VL-7B-SFT-2508
用戶可以根據實際需求,基於此模型進行SFT以及RL。相比於上一版SFT模型,該模型的RL穩定性更高。
開源地址:https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-SFT-2508