正文

阿里雲發佈超強AI大模型Qwen3-Max，性能傲視羣雄！

發布於AI新閒資訊

時間 :Sep 24, 2025

閱讀 :1分鐘

在人工智能的激烈競爭中，阿里雲再一次發力，正式推出了其最新的 AI 語言模型 ——Qwen3-Max。這款模型不僅是通義團隊迄今爲止規模最大、能力最強的產品，其參數總數超過了1萬億，顯著提升了多項技術能力，給業界帶來了新的震撼。

Qwen3-Max-Instruct 版本在代碼能力和智能體表現上都有了質的飛躍，特別是在知識推理、編程能力、指令遵循和多語言理解等多個領域，Qwen3-Max 的表現均處於行業領先水平。阿里雲的通義團隊還透露，另一個正在訓練中的版本 Qwen3-Max-Thinking 已展現出非凡的潛力，預計很快將與公衆見面。這個 “思考” 版本在一些高難度的推理測試中取得了100% 的準確率，顯示了其出色的推理能力。

在訓練方面，Qwen3-Max 模型的預訓練使用了36萬億個 tokens，得益於其獨特的 MoE 模型結構設計，訓練過程穩定且高效。通過 PAI-FlashMoE 的優化，Qwen3-Max 的訓練效率顯著提高，能夠支持長達1M 的上下文訓練。同時，阿里雲還通過多種技術手段降低了因硬件故障帶來的時間損失，確保了訓練的高效進行。

在實際應用中，Qwen3-Max-Instruct 已在 LMArena 的文本排行榜上穩居全球前三，超越了知名的 GPT-5-Chat。在專注於現實編程挑戰的基準測試 SWE-Bench Verified 中，Qwen3-Max-Instruct 取得了69.6的高分，顯示了其卓越的編程能力。而在智能體工具調用能力的測試 Tau2-Bench 中，Qwen3-Max-Instruct 也以74.8分的優異成績，成功超越了 Claude Opus4和 DeepSeek-V3.1。

可以說，阿里雲的 Qwen3-Max 不僅在技術參數上領先，更在應用性能上展現了強大的能力，爲人工智能的未來發展注入了新的動力。