7月23日,阿里雲正式宣佈其最新的AI編程大模型Qwen3-Coder全面開源,這一舉措迅速在智能編程領域掀起熱潮。Qwen3-Coder憑藉其卓越的代碼生成和Agent能力,在Agentic Coding、Agentic Browser-Use及基礎編碼任務上均取得了開源模型的頂尖水平,標誌着智能編程技術邁入了全新階段。

Qwen3-Coder模型系列提供了多個尺寸選擇,此次率先開源的是其最強大的版本——Qwen3-Coder-480B-A35B-Instruct。該模型採用先進的MoE架構,擁有高達480B的參數量,激活參數達35B,原生支持256K上下文,並可通過YaRN技術擴展至1M長度,爲處理大規模代碼庫和動態數據提供了強大支持。

微信截圖_20250723081042.png

在預訓練階段,通義團隊通過多維度擴展策略顯著提升了Qwen3-Coder的代碼能力。數據方面,總計7.5T的訓練數據中代碼佔比高達70%,確保了模型在保持通用與數學能力的同時,具備卓越的編程能力。上下文擴展方面,模型原生支持的長上下文處理能力,專爲倉庫級代碼和動態數據優化,極大地提升了Agentic Coding的效率和準確性。此外,通過合成數據擴展技術,利用Qwen2.5-Coder對低質數據進行清洗與重寫,進一步提升了整體數據質量。

後訓練階段,通義團隊創新性地採用了執行驅動的大規模強化學習策略,通過自動擴展測試樣例構造了大量高質量訓練實例。這一策略不僅顯著提升了代碼執行成功率,還對其他任務產生了積極影響。特別是在真實世界的軟件工程任務中,如SWE-Bench,Qwen3-Coder展現了出色的自主規劃、工具調用和決策能力,實現了在SWE-bench Verified上的開源模型最佳效果。

爲方便開發者使用,通義團隊還開源了命令行工具Qwen Code,該工具針對Qwen3-Coder系列模型進行了增強解析器和工具支持,使開發者能夠更充分地發揮模型在代理式編程上的潛力。同時,Qwen3-Coder的API也可與Claude Code、Cline等優秀編程工具協同使用,爲開發者提供了更加靈活和高效的編程體驗。

目前,Qwen3-Coder已在魔搭社區、HuggingFace等平臺全面開源,全球開發者均可免費下載使用。此外,該模型還將很快接入阿里的AI編程產品通義靈碼,進一步拓寬其應用場景。阿里雲百鍊平臺也已上線Qwen3-Coder的API,爲開發者提供了更加便捷的接入方式。

魔搭社區:https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct

Hugging Face:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507

Qwen Code GitHub:https://github.com/QwenLM/qwen-code