最近、中国のテクノロジー大手アリババグループは、アップグレードされた人工知能推論モデル「Qwen3-Max-Thinking」を発表しました。このモデルは、2つの世界的な数学コンペティションで満点を獲得し、推論および問題解決能力の強さを示しています。これにより、Qwen3-Max-Thinkingは、アメリカン・インビテーショナル・マス・テスト(AIME)とハーバード・マサチューセッツ・マス・トーナメント(HMMT)で100%の正確率を達成した最初の中国のAI推論モデルとなりました。

通義 Qwen (1)

図の出典:画像はAIによって生成されました

AIMEとHMMTは、算術、代数、数論、確率などの分野での問題解決能力を試す世界で最も難しい数学コンペティションの一つです。サンホセに本社を置くAIソフトウェア会社Intuition Labsによると、高得点の数学的推論テストは、AIモデルの推論および問題解決スキルを評価するために非常に重要です。これらのコンペティションは、AIの進歩における重要な前線であり、より強力な推論モデルを開発する競争を示しています。

Qwen3-Max-Thinkingモデルは、アリババのAIとクラウドコンピューティング部門が提供するQwen3-Maxシリーズの最新バージョンで、1兆を超えるパラメータを持っています。Qwen3-Maxは9月末にリリースされ、オリジナルのQwen3は4月にリリースされました。アリババクラウドは発表で、Qwen3-Maxが国内および国際的な競合の中で突出していることを明らかにしました。それは、AnthropicのClaude Opus4、DeepSeekのV3.1、xAIのGrok4、OpenAIのGPT-5Proを含みます。

注目すべきは、Qwen3-Maxが実際に市場に関与する実験でも優れた性能を発揮したことです。これは、米国と中国の5つの先進的なAIシステムと暗号通貨取引で対決しました。2週間の間に、Qwen3-Maxは22.3%の投資収益を達成し、他のモデルの成績は芳しくありませんでした。特に、OpenAIのGPT-5は62.7%の損失を記録しました。

現在、Qwen3-Max-Thinkingは、QwenチャットボットのWeb版およびアリババクラウドのAPIプラットフォームを通じて個人ユーザーに公開されています。Qwenチームの研究者であるリン・ジュンヤン氏はソーシャルメディアで、この新しい推論モデルの改善作業を継続していることを明らかにし、仕事はまだ完了していないと述べました。

ポイント:

- 📊 アリババのQwen3-Max-Thinkingは国際数学コンペティションで満点を獲得し、OpenAIを挑戦しました。

- 🏆 このモデルは1兆以上のパラメータを持ち、AIMEとHMMTで100%の正確率を達成した最初の中国のAIです。

- 📈 Qwen3-Maxは実際の暗号通貨市場で優れた成績を収め、22.3%の投資収益を達成しました。