人工知能の激しい競争の中で、アリババクラウドは再び力を入れ、最新のAI言語モデル「Qwen3-Max」を正式に発表しました。このモデルは、通義チームがこれまでに開発した中で最大規模かつ最も強力な製品であり、パラメータ数は1兆を超え、多くの技術能力が著しく向上し、業界に新たな衝撃を与えました。

Qwen3-Max-Instructバージョンは、コード処理能力和エージェントの表現において質的な飛躍を遂げており、特に知識推論、プログラミング能力、指示の理解、多言語理解などの分野において、Qwen3-Maxの性能は業界をリードしています。アリババクラウドの通義チームはまた、現在トレーニング中のもう一つのバージョンであるQwen3-Max-Thinkingも非凡な可能性を示しており、近く一般公開される予定です。この「思考」バージョンは、いくつかの高難度の推論テストで100%の正確率を達成し、優れた推論能力を示しています。

image.png

トレーニング面では、Qwen3-Maxモデルの前処理には36兆個のtokensが使用され、独自のMoEモデル構造設計により、トレーニングプロセスは安定して効率的です。PAI-FlashMoEによる最適化により、Qwen3-Maxのトレーニング効率は大幅に向上し、長さ1Mのコンテキストトレーニングをサポートできます。同時に、アリババクラウドはさまざまな技術手段を通じて、ハードウェア障害によって生じる時間損失を低減し、トレーニングの効率的な進行を確保しています。

image.png

実際の応用において、Qwen3-Max-InstructはLMArenaのテキストランキングで世界トップ3に安定してランクインし、有名なGPT-5-Chatを上回っています。現実的なプログラミングチャレンジに特化したベンチマークテストSWE-Bench Verifiedでは、Qwen3-Max-Instructは69.6という高い点数を獲得し、その優れたプログラミング能力を示しています。また、エージェントツール呼び出し能力のテストTau2-Benchでは、Qwen3-Max-Instructは74.8点という優れた成績を収め、Claude Opus4やDeepSeek-V3.1を上回りました。

言うまでもなく、アリババクラウドのQwen3-Maxは技術的なパラメータだけでなく、応用性能においても強い能力を示しており、人工知能の将来発展に新たな力となっています。