在人工智能的激烈競爭中,阿里雲再一次發力,正式推出了其最新的 AI 語言模型 ——Qwen3-Max。這款模型不僅是通義團隊迄今爲止規模最大、能力最強的產品,其參數總數超過了1萬億,顯著提升了多項技術能力,給業界帶來了新的震撼。
Qwen3-Max-Instruct 版本在代碼能力和智能體表現上都有了質的飛躍,特別是在知識推理、編程能力、指令遵循和多語言理解等多個領域,Qwen3-Max 的表現均處於行業領先水平。阿里雲的通義團隊還透露,另一個正在訓練中的版本 Qwen3-Max-Thinking 已展現出非凡的潛力,預計很快將與公衆見面。這個 “思考” 版本在一些高難度的推理測試中取得了100% 的準確率,顯示了其出色的推理能力。

在訓練方面,Qwen3-Max 模型的預訓練使用了36萬億個 tokens,得益於其獨特的 MoE 模型結構設計,訓練過程穩定且高效。通過 PAI-FlashMoE 的優化,Qwen3-Max 的訓練效率顯著提高,能夠支持長達1M 的上下文訓練。同時,阿里雲還通過多種技術手段降低了因硬件故障帶來的時間損失,確保了訓練的高效進行。

在實際應用中,Qwen3-Max-Instruct 已在 LMArena 的文本排行榜上穩居全球前三,超越了知名的 GPT-5-Chat。在專注於現實編程挑戰的基準測試 SWE-Bench Verified 中,Qwen3-Max-Instruct 取得了69.6的高分,顯示了其卓越的編程能力。而在智能體工具調用能力的測試 Tau2-Bench 中,Qwen3-Max-Instruct 也以74.8分的優異成績,成功超越了 Claude Opus4和 DeepSeek-V3.1。
可以說,阿里雲的 Qwen3-Max 不僅在技術參數上領先,更在應用性能上展現了強大的能力,爲人工智能的未來發展注入了新的動力。
