小米が最新のマルチモーダル大規模モデル Xiaomi MiMo-VL-7B-2508 をオープンソース化

小米のマルチモーダル大規模モデルチームは、最新のマルチモーダル大規模モデル「Xiaomi MiMo-VL-7B-2508」をオープンソース化したことを発表しました。このモデルにはRLとSFTの2つのバージョンが含まれています。

公式データによると、新バージョンのモデルは学問的推論、ドキュメント理解、グラフィックインターフェースの位置特定、ビデオ理解の4つの主要な能力において記録をすべて更新しました。その中で、MMMUベンチマークは初めて70点を超え、ChartQAは94.4に達し、ScreenSpot-v2は92.5、VideoMMEは70.8に上昇しました。

微信截图_20250809102003.png

今回のアップデートにより、強化学習の安定性と監督型微調整プロセスが最適化され、モデルの内部VLM Arenaスコアは1093.9から1131.2へと急騰しました。

特に注目すべきは、ユーザーが質問する際、「/no_think」というコマンドを使用して「思考モード」と「非思考モード」を自由に切り替えることができる点です。前者ではすべての推論プロセスを表示し、制御成功率は100%ですが、後者では直接答えを生成し、応答が速く、成功率は99.84%です。

MiMo-VL-7B-RL-2508

ほとんどの場合でこのモデルを体験することをお勧めします。
オープンソースのアドレス: https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL-2508

MiMo-VL-7B-SFT-2508

ユーザーは実際のニーズに応じて、このモデルを基にSFTやRLを行うことができます。前のバージョンのSFTモデルと比較して、このモデルはより高いRLの安定性を持っています。
オープンソースのアドレス: https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-SFT-2508

小米のAIチームが北京大学と共同で新論文を発表、雷軍が高給でスカウトした天才少女が研究に参加

小米と北京大学がarXivで共同論文を発表。筆頭著者の羅福莉氏（1995年生、北师大計算機科卒、現・北大計算言語学研究所所属）は以前、雷軍氏の高額年俸募集で注目されたが、本論文の著者リストでは小米大モデルチーム所属は明記されていない。....

生数科技、新規の数億人民元規模のAラウンド資金調達を完了

2025年9月19日、生数科技は新規の数億人民元規模のAラウンド資金調達を完了したと発表しました。今回の資金調達は博華キャピタルが主導し、百度戦略投資、北京市人工知能産業投資基金、啓明创投、達泰資本、BV百度風投など既存の株主が継続的に出資し、また建発新興投資などの産業パートナーも増資して参画しました。生数科技は2023年に設立されて以来、清華大学、北京大、インペリアル・カレッジ・ロンドン、カーネギー・メロン大学など世界トップクラスの大学から技術人材で構成された強力なコアチームによって運営されています。

小米が最新のマルチモーダル大規模モデル Xiaomi MiMo-VL-7B-2508 をオープンソース化

関連推奨

ブレイクスルー！上海交通大学と上海AIラボが協力してマルチモーダル大規模モデルの反省能力を向上

小米のAIチームが北京大学と共同で新論文を発表、雷軍が高給でスカウトした天才少女が研究に参加

TikTokとLV-NUSが共同でSAIL-VL2モデルを発表：小さくて力強い性能を発揮！

生数科技、新規の数億人民元規模のAラウンド資金調達を完了

小米AIメガネに支付宝の「スキャンして支払い」機能が登場、支払いはスマートグラスの標準機能に