アリババは、Qwenシリーズの新世代エクスプレスモデルである「Qwen3.6-Max-Preview」を正式にリリースしました。このモデルはシリーズの初期プレビュー版であり、ユーザーはQwenStudioで対話が可能で、アリババクラウド百煉APIを通じて「qwen3.6-max-preview」という名前で呼び出すことができます。前のバージョンであるQwen3.6-Plusと比較して、Qwen3.6-Max-Previewはエージェントプログラミング、世界知識、命令の遵守など複数の面で顕著な向上を遂げています。

image.png

アリババによると、Qwen3.6-Max-Previewは6つの主要なプログラミングベンチマークテストで最高点を記録し、これらにはSWE-benchPro、Terminal-Bench2.0、SkillsBench、QwenClawBench、QwenWebBench、SciCodeが含まれます。これらの成績は、このモデルがプログラミング能力において重要な一歩を踏み出したことを示しています。具体的には、エージェントプログラミング能力において、SkillsBenchでは9.9ポイント、SciCodeでは10.8ポイント、NL2RepoおよびTerminal-Bench2.0ではそれぞれ5.0ポイントと3.8ポイントの向上を記録しています。

さらに、Qwen3.6-Max-Previewは世界知識の習得においても顕著な強化が見られ、SuperGPQAでは2.3ポイント、QwenChineseBenchでは5.3ポイントの向上を記録しています。また、このモデルは命令の遵守能力においても優れた性能を発揮し、ToolcallFormatIFBenchでは2.8ポイントの向上を達成しています。これらの向上により、Qwen3.6-Max-Previewはスマートプログラミング分野における重要なイノベーションとなりました。

これはプレビュー版ですが、アリババはQwen3.6-Max-Previewが積極的に開発されており、今後のバージョンではさらに最適化され、より強力な機能とパフォーマンス向上を目指すと述べています。

ポイント:  

🌟 Qwen3.6-Max-Previewはアリババがリリースした最新のエクスプレスモデルで、プログラミング能力に顕著な向上があります。

📈 6つのプログラミングベンチマークテストで最高点を記録し、強力なスマートプログラミング能力を示しています。

🔧 このモデルは開発中であり、今後も最適化を進め、より優れたサービスを提供する予定です。