ヨーロッパのAIユニコーン企業Mistral AIが再び力を発揮し、コード作成に特化したオープンソースモデルの新シリーズ「Devstral2」を正式にリリースしました。このシリーズには、123Bパラメータのエース版「Devstral2」と24Bパラメータの軽量版「Devstral Small2」が含まれます。同時に、オープンソースのコマンドラインツール「Mistral Vibe CLI」もリリースされ、エンドツーエンドの自動プログラミングをサポートしています。今回のアップデートにより、オープンソースのコードエージェントは新たな高みに到達しました。Devstral2は、権威あるベンチマークテスト「SWE-bench Verified」で72.2点を獲得し、トップクラスの閉鎖型モデルと同等の性能を示しました。現在、APIは無料で公開されており、開発者にとって大きな恩恵となっています。

Devstral2ファミリー登場、二つのサイズで企業およびローカル環境に対応
Devstral2シリーズは密なTransformerアーキテクチャを採用しており、256Kという超長文脈窓をサポートしています。
- Devstral2(123B):企業向けの主力モデルで、ツール呼び出しや複数ファイル編集、複雑なコードベースの探索に特化しています。SWE-bench Verifiedのベンチマークで72.2点を記録し、オープンソースモデルの中でも最上位に位置しています。
- Devstral Small2(24B):軽量で効率的で、コンシューマー向けハードウェアでローカルで実行可能です。画像入力にも対応しており、プライバシーが重視されるまたはオフライン環境での使用に適しています。
両方のモデルはオープンソースで提供されており、前者は修正されたMITライセンス、後者はより柔軟なApache 2.0ライセンスが適用されています。現在、Devstral2は公式APIを通じて無料で利用可能であり、開発者の導入コストを大幅に下げています。
SWE-bench Verifiedで72.2点を記録、オープンソースコードエージェントの新王者
Devstral2は、実際のGitHubの問題解決を評価するSWE-bench Verifiedのベンチマークで72.2%の高いスコアを記録しました。これは多くのオープンソース競合製品よりも顕著に優れています。さらに少ないパラメータで効率的な出力を実現しています。パラメータ数が多い閉鎖型モデルと比較すると、コスト効率は7倍以上であり、特に大規模な自動コード作業に適しています。例えば、コードリファクタリングやバグ修正、複数ファイルの共同編集などです。
Mistral Vibe CLI: ターミナル内の全能型コードエージェント
Devstralによって駆動されるオープンソースCLIツールである「Mistral Vibe」は、自然言語を使ってコードベースを直接操作できます:
- プロジェクトのファイル構造とGitの状態を自動スキャンし、正確な文脈を提供します。
- @でファイルを参照したり、!でシェルコマンドを実行したり、スラッシュで指示をカスタマイズできます。
- 今編集中のファイルだけでなく、全体のコードベースを深く理解します。
- 永続的な会話履歴、自動補完機能、カスタマイズ可能なテーマが付いており、インタラクティブな体験を向上させます。
このツールはターミナルで独立して動作することも、IDEに統合されることも可能です。本当に「エンドツーエンドの自動化」を実現し、開発者は会話形式の指示を通じて、探索、変更、実行の全プロセスを完了できます。
エコシステムとの統合とオープン戦略、分散型インテリジェンスの加速
Mistralは今回のリリースにおいて、オープン性と実用性を強調しています。すでにいくつかのオープンソースエージェントプラットフォームと深い協力関係を築いており、開発者が迅速に接続できるようにしています。Devstral2シリーズは企業向けの生産環境だけでなく、個人開発者向けのローカルデプロイオプションも提供し、AIコードツールの民主化を推進しています。
