近日,中國科技巨頭阿里巴巴集團發佈了升級版的人工智能推理模型 ——Qwen3-Max-Thinking。該模型在兩項全球頂級數學競賽中取得了滿分,展示了其在推理和問題解決方面的強大能力。這使得 Qwen3-Max-Thinking 成爲首個在美國邀請數學考試(AIME)和哈佛 - 麻省理工數學錦標賽(HMMT)中取得100% 準確率的中國 AI 推理模型。

圖源備註:圖片由AI生成
AIME 和 HMMT 是全球最具挑戰性的數學競賽之一,考察選手在算術、代數、數論和概率等領域的解題能力。根據位於聖荷西的 AI 軟件公司 Intuition Labs 的說法,高分的數學推理測試對於評估 AI 模型的推理和問題解決技能至關重要。這些競賽代表了 AI 進步的一個重要前沿,顯示了開發更強推理模型的競爭。
Qwen3-Max-Thinking 模型是阿里巴巴 AI 與雲計算部門推出的 Qwen3-Max 系列中的最新版本,具備超過1萬億個參數。Qwen3-Max 於9月底發佈,而原始的 Qwen3則在4月推出。阿里雲在發佈會上表示,Qwen3-Max 在國內外的競爭對手中表現突出,包括 Anthropic 的 Claude Opus4、DeepSeek 的 V3.1、xAI 的 Grok4以及 OpenAI 的 GPT-5Pro。
值得一提的是,Qwen3-Max 還在一項涉及真實市場的實驗中表現出色,與五個美國和中國的領先 AI 系統在加密貨幣交易中對決。在兩週的時間內,Qwen3-Max 實現了22.3% 的投資回報,而其他模型的表現則不盡人意,OpenAI 的 GPT-5更是遭遇了62.7% 的損失。
目前,Qwen3-Max-Thinking 已通過 Qwen 聊天機器人的網頁版本和阿里雲的 API 平臺向個人用戶開放。Qwen 團隊的研究員林俊揚在社交媒體上透露,他們仍在繼續改進這一新推理模型,表示工作尚未完成。
劃重點:
- 📊 阿里巴巴的 Qwen3-Max-Thinking 在國際數學競賽中獲得滿分,挑戰 OpenAI。
- 🏆 該模型具備超過1萬億個參數,是首個在 AIME 和 HMMT 中取得100% 準確率的中國 AI。
- 📈 Qwen3-Max 在真實市場的加密貨幣交易中表現優異,獲得22.3% 的投資回報。
