近日,崑崙萬維正式發佈了其全新開源模型 Skywork-R1V3.0,宣稱在多模態推理方面達到了前所未有的高度,甚至與人類初級專家的水平不相上下。該模型在訓練過程中採用了強化學習策略,使得其在複雜邏輯建模與跨學科知識泛化方面取得了顯著進展。

Skywork-R1V3.0是基於上一代 Skywork-R1V2.0進行 “冷啓動”,利用高質量的蒸餾數據和拒絕採樣技術,成功構建了一個強大的多模態推理訓練集。這一模型的設計不僅僅侷限於文本,還涵蓋了圖像處理,使得其在圖像與文本之間的推理能力得到了顯著提升。

image.png

據介紹,Skywork-R1V3.0的訓練依賴於僅約1.2萬條監督微調樣本和1.3萬條強化學習樣本,展現了 “小數據激發大能力” 的獨特優勢。在權威的綜合性多模態評測 MMMU 中,Skywork-R1V3.0以76.0分的成績領先,超越了 Claude-3.7-Sonnet(75.0分)和 GPT-4.5(74.4分)等閉源模型,證明了其卓越的跨模態理解能力。

在具體的應用場景中,Skywork-R1V3.0在物理、邏輯和數學推理等多個領域均表現出色。例如,在物理推理的評測中,該模型分別取得了52.8分和31.5分的最佳開源成績,顯示出其對複雜物理問題的理解能力。此外,在邏輯推理測試中,Skywork-R1V3.0也取得了59.7分的佳績。

image.png

該模型在數學推理方面同樣不容小覷,在 MathVista、MathVerse 和 MathVision 等評測中分別獲得77.1分、59.6分和52.6分的優異成績,明顯優於其他開源模型。這些出色的表現使得 Skywork-R1V3.0在當前的開源多模態推理領域中成爲了一個強有力的競爭者。

image.png

Skywork-R1V3.0的發佈標誌着多模態推理技術的一個新高峯,它的強大性能和開源特性將極大促進 AI 技術的進一步發展。