阿里巴巴正式發佈千問系列旗艦推理模型——Qwen3-Max-Thinking。該模型在複雜推理、事實知識及智能體能力等核心維度實現跨越式升級,號稱總參數量已突破萬億大關。在多項權威基準測試中,其綜合表現已能與 GPT-5.2-Thinking、Claude-Opus-4.5及 Gemini3Pro 等全球頂尖模型並駕齊驅。

Qwen3-Max-Thinking 採用了更爲大規模的強化學習訓練,並引入了“自適應工具調用”和“測試時擴展”兩項核心創新技術。它不僅能像人類專家一樣在思考的同時自主調用搜索、記憶和代碼解釋器,還顯著降低了模型幻覺,使其在處理真實世界的複雜任務時更加智能、流暢。
目前,Qwen3-Max-Thinking 已正式上線 Qwen Chat 供用戶交互體驗,其 API(模型名稱:qwen3-max-2026-01-23)也已同步向開發者開放。
劃重點:
🚀 性能對標國際頂流:在19項權威測試中,Qwen3-Max-Thinking 的性能媲美 GPT-5.2和 Claude-4.5,處於國際領先水平。
🤖 原生智能體能力:模型具備自適應工具調用能力,可根據任務需求自主選擇搜索引擎或代碼解釋器,實現“邊用邊思”。
🧠 萬億級參數推理:通過更大規模的強化學習與測試時擴展(Test-Time Scaling)技術,大幅提升了在科學知識與數學推理等高難度領域的表現。
