最近、Mistral AI は All Hands AI と提携し、開発者向けに大型言語モデル「Devstral2507シリーズ」をリリースしました。このシリーズには、新しい2つのモデル、Devstral Small1.1とDevstral Medium2507が含まれています。これらのモデルは、インテリジェントエージェントに基づくコード推論、プログラム合成、構造化タスクの実行をサポートし、大規模なソフトウェアコードベースでの実際の応用に適しています。今回のリリースではパフォーマンスとコストの最適化が行われており、開発ツールやコード自動化システムにおける広範な応用可能性を備えています。
Devstral Small1.1はオープンソースモデルで、Mistral-Small-3.1の基礎モデルを基にし、約240億のパラメータを持っています。このモデルは128kのコンテキストウィンドウをサポートしており、複数ファイルのコード入力や複雑な長文プロンプトを処理でき、ソフトウェアエンジニアリングのワークフローに合致しています。このバージョンは特に構造化出力を微調整しており、XMLや関数呼び出し形式を含むもので、OpenHandsなどのエージェントフレームワークと互換性があります。これは、プログラムナビゲーション、マルチステップ編集、コード検索などのタスクに適しています。Devstral Small1.1のライセンスはApache2.0であり、研究および商業用途が可能です。
パフォーマンステストにおいて、Devstral Small1.1はSWE-Bench Verifiedベンチマークテストで53.6%のスコアを獲得し、実際にGitHubの問題に対して正しいパッチを生成する能力が高いことを証明しています。ただし、大型の商用モデルに比べて性能は劣るものの、サイズ、推論コスト、推論能力のバランスを取っているため、さまざまなコーディングタスクに適しています。
さらに、このモデルは高メモリGPU(例えばRTX4090)または32GB RAM以上のApple Siliconマシンでローカル推論可能な量産版として多数の形式でリリースされています。同時に、Mistralはその推論APIを通じてモデルを提供しており、現在の料金体系はMistral-Smallシリーズモデルと同じです。
Devstral Medium2507は、Mistral APIまたは企業向け導入契約のみで提供され、オープンソースではありません。このモデルはSWE-Bench Verifiedベンチマークテストで61.6%のスコアを取得し、長文の推論能力が優れ、一部の商用モデル(Gemini2.5ProやGPT-4.1)を超えることが確認されています。このモデルのAPI料金はSmallバージョンより高くなりますが、強力な推論能力により、大規模なコードベースでのタスク実行に非常に適しています。
Devstral Smallはローカル開発、実験、またはクライアント開発ツールへの統合に適しており、Devstral Mediumは構造化されたコード編集タスクにおいて高い正確性と一貫性を提供し、高性能が必要な本番環境サービスに適しています。両モデルはコードエージェントフレームワークとの統合をサポートしており、テスト生成、リファクタリング、エラー修正の自動化ワークフローを簡素化することができます。
今回のリリースによって、Mistral AIのDevstral2507シリーズは、異なるソフトウェアエンジニアリングニーズに対応するための選択肢を提供し、実験的なエージェント開発からビジネス環境での本格的導入まで、効果的なサポートが得られます。
huggingface:https://huggingface.co/mistralai/Devstral-Small-2507
ポイント:
🌟 Devstral2507シリーズには、オープンソースのDevstral Small1.1と企業向けのDevstral Medium2507が含まれており、コード推論と自動化能力を向上させることを目的としています。
🚀 Devstral Small1.1はSWE-Benchベンチマークテストで53.6%のスコアを達成し、Devstral Medium2507は61.6%で、後者は一部の商用モデルを上回っています。
💼 両モデルはコードエージェントフレームワークとの統合をサポートしており、ローカル開発から企業向けサービスまで多様なシナリオに適しています。