正文

阿里Qwen3-Max-Thinking在全球數學競賽中拔得頭籌，挑戰 OpenAI 的領先地位

發布於AI新閒資訊

時間 :Nov 10, 2025

閱讀 :1分鐘

近日，中國科技巨頭阿里巴巴集團發佈了升級版的人工智能推理模型 ——Qwen3-Max-Thinking。該模型在兩項全球頂級數學競賽中取得了滿分，展示了其在推理和問題解決方面的強大能力。這使得 Qwen3-Max-Thinking 成爲首個在美國邀請數學考試（AIME）和哈佛 - 麻省理工數學錦標賽(HMMT)中取得100% 準確率的中國 AI 推理模型。

通義 Qwen (1)

圖源備註：圖片由AI生成

AIME 和 HMMT 是全球最具挑戰性的數學競賽之一，考察選手在算術、代數、數論和概率等領域的解題能力。根據位於聖荷西的 AI 軟件公司 Intuition Labs 的說法，高分的數學推理測試對於評估 AI 模型的推理和問題解決技能至關重要。這些競賽代表了 AI 進步的一個重要前沿，顯示了開發更強推理模型的競爭。

Qwen3-Max-Thinking 模型是阿里巴巴 AI 與雲計算部門推出的 Qwen3-Max 系列中的最新版本，具備超過1萬億個參數。Qwen3-Max 於9月底發佈，而原始的 Qwen3則在4月推出。阿里雲在發佈會上表示，Qwen3-Max 在國內外的競爭對手中表現突出，包括 Anthropic 的 Claude Opus4、DeepSeek 的 V3.1、xAI 的 Grok4以及 OpenAI 的 GPT-5Pro。

值得一提的是，Qwen3-Max 還在一項涉及真實市場的實驗中表現出色，與五個美國和中國的領先 AI 系統在加密貨幣交易中對決。在兩週的時間內，Qwen3-Max 實現了22.3% 的投資回報，而其他模型的表現則不盡人意，OpenAI 的 GPT-5更是遭遇了62.7% 的損失。

目前，Qwen3-Max-Thinking 已通過 Qwen 聊天機器人的網頁版本和阿里雲的 API 平臺向個人用戶開放。Qwen 團隊的研究員林俊揚在社交媒體上透露，他們仍在繼續改進這一新推理模型，表示工作尚未完成。

劃重點:
- 📊 阿里巴巴的 Qwen3-Max-Thinking 在國際數學競賽中獲得滿分，挑戰 OpenAI。
- 🏆 該模型具備超過1萬億個參數，是首個在 AIME 和 HMMT 中取得100% 準確率的中國 AI。
- 📈 Qwen3-Max 在真實市場的加密貨幣交易中表現優異，獲得22.3% 的投資回報。

千問PC和網頁端上線國內最強推理模型，主動性更強、擅長邏輯推理

阿里發佈旗艦推理模型Qwen3-Max-Thinking，參數量超萬億，預訓練數據達36T Tokens。該模型通過強化學習訓練，在事實知識、數學推理等方面表現優異，已接入千問PC端和網頁端，App即將支持。用戶可一鍵切換體驗更強推理能力。

Jan 27, 2026

270.8k

算力巔峯對決！阿里發佈 Qwen3-Max-Thinking，正面硬剛 GPT-5.2

阿里發佈千問旗艦推理模型Qwen3-Max-Thinking，性能大幅提升，在19項基準測試中表現突出，挑戰GPT-5.2和Gemini3Pro。模型通過兩大創新實現更聰明、高效的推理能力，展現中國AI實力。

Jan 27, 2026

252.0k

國產推理模型新標杆！阿里發佈萬億參數 Qwen3-Max-Thinking，性能直指 GPT-5.2

阿里巴巴發佈Qwen3-Max-Thinking推理模型，參數量超萬億，在複雜推理、事實知識及智能體能力上實現顯著提升。該模型採用大規模強化學習訓練，引入自適應工具調用和測試時擴展技術，綜合性能已媲美GPT-5.2-Thinking等國際頂尖模型。

Jan 27, 2026

244.5k

阿里雲發佈超強AI大模型Qwen3-Max，性能傲視羣雄！

阿里雲發佈萬億參數AI語言模型Qwen3-Max，爲通義團隊迄今最強產品。該模型在代碼能力、智能體表現上實現質的飛躍，顯著提升知識推理、編程、指令遵循及多語言理解等核心技術，展現行業領先實力。

Sep 24, 2025

229.5k

OpenAI 新系統阻斷生物和化學風險信息，保障 AI 安全

OpenAI 近期推出了一項新系統，旨在監控其最新的 AI 推理模型 o3和 o4-mini，以阻止與生物和化學威脅相關的提示。該系統的目標是防止模型提供可能教唆他人實施有害攻擊的建議，確保 AI 的安全性。OpenAI 表示，o3和 o4-mini 在能力上較之前的模型有顯著提升，因此在惡意用戶手中可能帶來新的風險。根據 OpenAI 的內部基準測試，o3在回答關於某些生物威脅的相關問題時，表現得尤爲出色。爲了應對這些風險，OpenAI 開發了這個新的監控系統，稱之爲 “以安全爲中心的推理監測器”。這個監測器

Apr 17, 2025

361.7k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

​阿里Qwen3-Max-Thinking在全球數學競賽中拔得頭籌，挑戰 OpenAI 的領先地位

相關推薦

千問PC和網頁端上線國內最強推理模型，主動性更強、擅長邏輯推理

算力巔峯對決！阿里發佈 Qwen3-Max-Thinking，正面硬剛 GPT-5.2

​國產推理模型新標杆！阿里發佈萬億參數 Qwen3-Max-Thinking，性能直指 GPT-5.2

阿里雲發佈超強AI大模型Qwen3-Max，性能傲視羣雄！

​OpenAI 新系統阻斷生物和化學風險信息，保障 AI 安全

阿里Qwen3-Max-Thinking在全球數學競賽中拔得頭籌，挑戰 OpenAI 的領先地位

國產推理模型新標杆！阿里發佈萬億參數 Qwen3-Max-Thinking，性能直指 GPT-5.2

OpenAI 新系統阻斷生物和化學風險信息，保障 AI 安全