アリババは正式に千問シリーズのエンドモデルであるQwen3-Max-Thinkingを発表しました。このモデルは複雑な推論、事実知識およびエージェント機能などの主要な次元で飛躍的なアップグレードを実現し、総パラメータ数が1兆を超えました。複数の権威あるベンチマークテストにおいて、その総合的な性能はGPT-5.2-Thinking、Claude-Opus-4.5、Gemini3Proなど世界トップクラスのモデルと同等であることが確認されています。

Qwen3-Max-Thinkingはより大規模な強化学習によるトレーニングを採用し、「適応型ツール呼び出し」と「テスト時拡張」という2つの核心技術を導入しています。これは、人間の専門家のように思考しながら検索や記憶、コードインタプリタを自動的に呼び出せるだけでなく、モデルの幻覚を顕著に低減し、現実世界の複雑なタスク処理においてより知的かつスムーズな性能を実現しています。
現在、Qwen3-Max-ThinkingはQwen Chat上で正式に公開され、ユーザーによるインタラクティブな体験が可能です。また、API(モデル名:qwen3-max-2026-01-23)も開発者向けに同時に公開されています。
重要なポイント:
🚀 国際的トップレベルと同等の性能: 19の権威あるテストにおいて、Qwen3-Max-Thinkingの性能はGPT-5.2やClaude-4.5と同等であり、世界的に先進的な水準に達しています。
🤖 ネイティブなエージェント能力: モデルは適応型ツール呼び出し機能を持ち、タスクのニーズに応じて検索エンジンやコードインタプリタを自動的に選択できます。「使いつつ考える」ことを実現します。
🧠 トリアクセス級のパラメータでの推論: より大規模な強化学習とテスト時拡張(Test-Time Scaling)技術により、科学的知識や数学的推論などの高度な分野での性能が大幅に向上しています。
