阿里巴巴 **Qwen(通義千問)**團隊近日發佈了兩個新的小規模多模態模型:Qwen3-VL-30B-A3B-InstructQwen3-VL-30B-A3B-Thinking。每個模型擁有 30億個活躍參數,但在性能上卻有着巨大的野心。

阿里通義qwen

據 Qwen 團隊介紹,這兩個新版本旨在與 GPT-5-Mini 和 Claude4Sonnet 等頂尖模型競爭,並在某些基準測試中,在數學、圖像識別、文本識別、視頻處理和代理控制等關鍵領域展現出更強的性能。

這一系列產品還包括一個用於更快推理的 FP8版本,以及 Qwen3-VL-235B-A22B 模型的 FP8變體。

這些模型已全面開放獲取,用戶和開發者可以通過 HuggingFace、ModelScope 和 GitHub 下載使用,也可通過阿里雲 API 調用。此外,Qwen 也提供了一個可直接使用的網頁聊天界面。這一發布強調了 Qwen 團隊在推動高效、高性能小模型普及化方面的努力。