崑崙萬維正式推出 Skywork R1V4-Lite,這是一款集成視覺操作、推理與規劃能力的輕量級多模態智能體。與傳統模型不同,Skywork R1V4-Lite 不僅具備深度推理能力,還能夠主動進行圖像操作、外部工具調用和多模態深度研究,使其在複雜場景中的應用更加靈活。

image.png

用戶只需拍一張照片,Skywork R1V4-Lite 便可快速完成任務,自動判斷空間位置、放大模糊文字、繪製輔助線等。這款智能體的設計讓人們不再需要複雜的提示詞,只需簡單的視覺輸入,系統就能自我推理並給出解決方案。這一特性使得多模態智能體從封閉推理向開放交互的轉變成爲可能。

Skywork R1V4-Lite 在多個權威基準測試中表現出色,尤其在多模態理解任務上超過 Gemini2.5Flash,展現了其極強的競爭力。其主動圖像操作能力讓模型在面對信息不足或視角受限的場景時,能夠自動裁剪、放大和旋轉圖像,構建出清晰可回溯的 “視覺行動鏈”。

image.png

此外,Skywork R1V4-Lite 還支持聯網搜索,能夠在執行任務時觸發深度研究,通過與外部資源交互,提升推理的深度和廣度。這種跨模態的知識擴展能力,使得其在學術、法律、生態以及電商等多個領域展現出廣泛應用潛力。

最令人期待的是,Skywork R1V4-Lite 還具備主動式任務規劃能力,能夠基於視覺輸入生成可執行的任務鏈。這意味着,用戶不僅可以得到回答,更可以通過智能體制定出詳細的行動計劃,爲各種場景提供精準的解決方案。

Skywork R1V4-Lite Github地址:

https://github.com/SkyworkAI/Skywork-R1V 

劃重點:

🌟 Skywork R1V4-Lite 是一款輕量級多模態智能體,具備視覺操作、推理與規劃三大能力。  

📸 用戶只需拍一張圖,系統便可自動完成複雜任務,提升操作便利性。  

🔍 該智能體在多模態理解基準測試中表現優異,展現出強大的跨模態推理與知識擴展能力。