崑崙萬維正式發佈了全球首個工業界多模態推理模型 Skywork R1V(簡稱 “R1V”)。這款具有38億參數的模型在性能上已接近知名閉源模型 DeepSeek-R1,甚至在多個基準測試中表現出色,橫掃了一系列當前的最先進技術(SOTA)。崑崙萬維選擇開源 R1V,旨在推動技術的共享與進步,爲全球 AI 開源社區注入新活力。

QQ_1742285189313.png

R1V 以其卓越的多模態推理能力而聞名,能夠無縫結合文本和視覺信息,展示出強大的智能。具體來看,R1V 在視覺問答任務中直接對標 Claude3.5Sonnet 和 GPT-4o 等閉源模型,並保持頂級文本推理能力。在 MMMU 基準測試中,R1V 以69分的高分創造了同等規模模型的新紀錄,而在 MathVista 測試中也取得了67.5分的優異成績,顯示了其在複雜數學推理和邏輯分析中的強大能力。

R1V 的成功得益於崑崙萬維研究團隊的多項創新技術。其中,包括跨模態遷移學習,該方法有效地將大模型的文本推理能力遷移至視覺模態,極大地減少了多模態推理數據的需求。此外,R1V 採用的混合訓練策略通過迭代監督微調和強化學習的結合,動態調整思維鏈長度,從而提高了推理效率。值得一提的是,R1V 還引入了自適應長度思維鏈蒸餾框架,以避免推理過程中的 “過度思考”,顯著提升了推理的效率和質量。

隨着 R1V 的推出,崑崙萬維不僅成爲全球首家開源多模態推理模型的公司,更在推動 AGI(通用人工智能)夢想的實現上邁出了重要的一步。模型的權重、推理代碼和技術報告均已公開,任何人都可以通過 GitHub 和 Hugging Face 獲取相關資源。

模型權重下載

Hugging Face:

https://huggingface.co/Skywork/Skywork-R1V-38B

GitHub:

https://github.com/SkyworkAI/Skywork-R1V

詳細技術報告

https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V.pdf

劃重點:

🌟 全球首個工業界開源多模態推理模型 Skywork R1V 正式發佈,參數高達38億。  

🚀 R1V 在多個基準測試中表現卓越,尤其在 MMMU 和 MathVista 中分別取得69分和67.5分的高分。  

📚 崑崙萬維的開源舉措旨在推動技術共享,爲全球 AI 開源社區注入活力,助力 AGI 的夢想實現。