阿里巴巴正式發佈了 Qwen 系列新一代旗艦模型 ——Qwen3.6-Max-Preview。這一模型是該系列的早期預覽版,用戶可以在 QwenStudio 中與之進行交互對話,並通過阿里雲百鍊 API 以 qwen3.6-max-preview 的名稱進行調用。與前一代 Qwen3.6-Plus 相比,Qwen3.6-Max-Preview 在智能體編程、世界知識和指令遵循等多個方面都有了顯著提升。

image.png

根據阿里巴巴的介紹,Qwen3.6-Max-Preview 在六項主要編程基準測試中取得了最高分,這些基準包括 SWE-benchPro、Terminal-Bench2.0、SkillsBench、QwenClawBench、QwenWebBench 以及 SciCode。這些成績標誌着該模型在編程能力上邁出了重要一步。具體來說,在智能體編程能力方面,Qwen3.6-Max-Preview 在 SkillsBench 中提高了 9.9 分,在 SciCode 中提升了 10.8 分,而在 NL2Repo 和 Terminal-Bench2.0 中分別提升了 5.0 分和 3.8 分。

此外,Qwen3.6-Max-Preview 在世界知識的掌握上也有顯著增強,SuperGPQA 的分數提升了 2.3 分,QwenChineseBench 則提高了 5.3 分。同時,該模型在指令遵循能力方面表現出色,ToolcallFormatIFBench 的分數提高了 2.8 分。這些提升使得 Qwen3.6-Max-Preview 成爲了智能編程領域的重要創新。

儘管這是預覽版本,阿里巴巴表示,Qwen3.6-Max-Preview 仍在積極開發中,後續版本將繼續進行優化,力爭在未來帶來更爲強大的功能和性能提升。

劃重點:  

🌟 Qwen3.6-Max-Preview 是阿里巴巴發佈的最新旗艦模型,具有顯著的編程能力提升。  

📈 六項編程基準測試中,該模型均取得最高分,展示出強大的智能編程能力。  

🔧 該模型仍在開發中,未來將繼續優化以提供更優質的服務。