7月30日,阿里巴巴的通義千問團隊正式推出了 Qwen3系列模型的最新成員 ——Qwen3-30B-A3B-Instruct-2507。這一全新的開源模型採用非思考模式(non-thinking mode),僅需激活3B 參數,就能在多個核心能力上與 Gemini2.5-Flash 和 GPT-4o 等知名閉源模型相媲美。此外,Qwen3-30B-A3B-Instruct-2507在多語言支持、用戶偏好對齊和長文本處理等方面也實現了顯著突破。

該模型現已在魔搭社區(ModelScope)和 HuggingFace 平臺上全面開源。作爲 Qwen3-30B-A3B 系列中的新版本,Qwen3-30B-A3B-Instruct-2507不僅繼承了通義千問團隊在架構創新方面的優勢,還大幅降低了計算成本,力求與千億級閉源模型的性能相對接。

image.png

根據官方數據,Qwen3-30B-A3B-Instruct-2507在數學推理(AIME25測試得分61.3)、代碼生成(LiveCodeBenchv6得分43.2)、研究生級物理與天文學問題(GPQA 測試得分70.4)及人類偏好對齊(Arena-Hard v2得分69)等多個關鍵基準測試中表現出色,甚至在部分指標上超越了 GPT-4o。這一成就標誌着該模型在邏輯推理、數學、科學和編程等多個領域的全面能力得到了顯著提升。

更值得一提的是,Qwen3-30B-A3B-Instruct-2507在多語言的長尾知識覆蓋上也表現優異,並在主觀和開放任務中更好地對齊用戶的偏好,生成更高質量的文本,爲用戶提供更有價值的答案。同時,其長文本理解能力也提升至256K,意味着用戶能夠處理更加複雜的文本內容。

自2023年發佈以來,通義千問系列模型已開源超過200個,全球下載量突破3億次,衍生模型數量超過10萬個,展現了強大的市場影響力和技術潛力。