アリは新しく多モーダル大モデル「Qwen3.7-Plus」を正式に発表しました。このモデルは、Qwen3.7の強力なテキスト処理能力を基盤として、視覚・言語能力を全面的にアップグレードし、統合されたスマートエージェントベースにしています。「多モーダルインタラクションハイブリッドエージェント」として、GUI(グラフィカルユーザーインターフェース)とCLI(コマンドラインインターフェース)のインタラクションをスムーズに統合し、フロントエンドプロトタイプから複雑なソフトウェア開発まで、エンドツーエンドの自動化を実現しています。

権威あるビジュアルモデルランキング「Vision Arena」において、Qwen3.7-Plusの優れたパフォーマンスにより、アリは「世界トップ5、中国第1位」にランクインしました。
主要な技術的能力と評価結果
Qwen3.7-Plusの主な利点は、「見る、考える、書く、行う、検証する」を統一されたループに統合し、3つの方向で最高レベルの性能を示しています:
純テキストと推論エージェント: Terminal Bench2.0、SWE-bench、SciCodeなどの複雑なソフトウェアエンジニアリングおよび科学プログラミングタスクで優れたパフォーマンスを発揮します。GPQA Diamondなどの高難易度STEM推論ベンチマークでは、Plusクラスモデルの中で上位に位置しています。
マルチモーダル推論とビジュアルプログラミング: 強力な空間モデリングとパス検索能力(BabyVisionでの顕著な向上)を持っています。また、画像、動画、UIスクリーンショットをワンクリックで実行可能なコードに変換することも可能です(SVG再現やインタラクティブなウェブデザインなど)。
現実世界の認識と動画理解: ドキュメント解析、高度なOCR、長時間の動画イベントストリームの理解をカバーしており、LingoQAなどの運転シナリオ評価で、動的空間関係の正確な把握を示しています。

画期的な実際の応用場面
発表会では、Qwen3.7-Plusに基づいて構築された多数の前線的なスマートエージェントシステムが紹介されました。
APP全工程の自律開発: テスト中、Hybrid-Agentシステムは11時間以上安定して動作し、呼び出し回数は1000回を超え、1万行以上のコードを自主的に生成し、要件文書からテスト、デプロイに至る英語学習アプリの開発フローを完全に自動化しました。
デスクトップアプリの高精度な再現: エージェントはmacOSネイティブの「株式市場」アプリを自律的に操作し、レイアウトを理解した後、SwiftUIソースコードを自動的に作成し、リアルタイムの株価APIに接続しました。最終的に10項目の機能検証テストをすべて通過し、ネイティブのダークテーマとインタラクティブ体験を完璧に再現しました。
クラウドコントロールプレーンの無人運用: Qwen3.7-Plusを基盤とした「Qwen for Chrome」ブラウザ拡張機能は、非専門家の自然言語の要望を理解し、アリ雲コントロールプレーンに自動的にアクセスし、ECSサーバーの価格比較、選定、設定、購入を行います。さらに、停止時の拡張などの複雑な運用管理アップグレードを自主的に処理できます。
現在、Qwen3.7-Plusは
