據財聯社報道,阿里巴巴新一代基座模型 Qwen3.5 已在 HuggingFace 的 Transformers 項目中出現代碼合併申請(PR),預示發佈在即。

據悉,Qwen3.5採用了全新的混合注意力機制,並極有可能是一款原生支持視覺理解的 VLM 模型。目前開發者挖掘的信息顯示,Qwen3.5預計將開源至少 2B 的密集模型以及 35B-A3B 的 MoE 模型。此前有消息稱,該系列模型將在今年春節期間正式開源。

通義 Qwen (1)千問