阿里通義千問近日宣佈,Qwen3-VL 家族迎來了新的成員,新增了2B 和32B 兩種密集模型尺寸。這一擴展使得模型覆蓋了從輕量級到高性能的視覺語言理解場景,開發者可以在手機等設備上運行這些模型,極大地方便了開發與應用。

此次推出的兩種模型版本各有特色。首先是 Instruct 模型,該模型具有響應速度快、執行穩定的優勢,特別適合用於對話系統及工具調用。其次是 Thinking 模型,這一版本則在長鏈推理和複雜視覺理解方面表現出色,具備 “看圖思考” 的能力,可以處理更具挑戰性的任務。
根據官方發佈的信息,Qwen3-VL-32B 在多個領域的表現均優於市場上的一些競爭對手,如 GPT-5mini 和 Claude4Sonnet。它僅使用32B 參數就能夠與高達235B 參數的模型相媲美,甚至在 OSWorld 上取得了優異的成績。與此同時,Qwen3-VL-2B 則以其小巧的體量,在極限端側設備上也能實現令人驚訝的性能表現,適合開發者進行實驗和部署。
對於有興趣的開發者,阿里通義還提供了體驗鏈接,方便用戶在 ModelScope 和 Hugging Face 上試用這些新模型。這些模型的推出不僅擴展了阿里通義在人工智能領域的產品線,也爲視覺語言理解的應用提供了更多可能。
劃重點:
🌟 新增模型:阿里通義 Qwen3-VL 家族新增2B 和32B 兩種密集模型尺寸。
📱 設備兼容:新模型可在手機等設備上運行,便於開發者使用。
🏆 性能卓越:Qwen3-VL-32B 在多領域表現優於許多競爭對手。
