近日,Mistral AI 與 All Hands AI 合作,推出了針對開發者的大型語言模型 Devstral2507系列,包含兩款新模型:Devstral Small1.1和 Devstral Medium2507。這些模型旨在支持基於智能代理的代碼推理、程序合成和結構化任務執行,適用於大型軟件代碼庫的實際應用。這次發佈在性能和成本上進行了優化,使其在開發工具和代碼自動化系統中具有廣泛的應用潛力。
Devstral Small1.1是一款開源模型,基於 Mistral-Small-3.1基礎模型,擁有約240億個參數。該模型支持128k 的上下文窗口,能夠處理多文件代碼輸入和複雜的長提示,符合軟件工程工作流程的特點。此版本特別針對結構化輸出進行微調,包括 XML 和函數調用格式,使其與 OpenHands 等代理框架兼容,適合程序導航、多步驟編輯和代碼搜索等任務。Devstral Small1.1的許可爲 Apache2.0,支持研究和商業用途。
在性能測試方面,Devstral Small1.1在 SWE-Bench Verified 基準測試中獲得53.6% 的成績,證明其在爲真實的 GitHub 問題生成正確補丁方面表現優異。雖然其性能不及大型商業模型,但在大小、推理成本和推理能力之間找到了一個平衡點,適合多種編碼任務。
此外,該模型以多種格式發佈,包括可以在高內存 GPU(如 RTX4090)或32GB RAM 以上的 Apple Silicon 機器上進行本地推理的量化版本。同時,Mistral 還通過其推理 API 提供模型,當前的收費標準與 Mistral-Small 系列模型相同。
Devstral Medium2507則僅通過 Mistral API 或企業部署協議提供,並不開放源代碼。該模型在 SWE-Bench Verified 基準測試中得分爲61.6%,在長上下文的推理能力上表現出色,能夠超越一些商業模型,如 Gemini2.5Pro 和 GPT-4.1。此模型的 API 收費標準高於 Small 版本,但其強大的推理能力使其非常適合在大型代碼庫中執行任務。
Devstral Small 更適合本地開發、實驗或集成到客戶端開發工具中,而 Devstral Medium 則在結構化代碼編輯任務中提供更高的準確性和一致性,適合需要高性能的生產服務。兩款模型的設計都支持與代碼代理框架的集成,使其能夠簡化測試生成、重構和錯誤修復的自動化工作流程。
通過此次發佈,Mistral AI 的 Devstral2507系列爲開發者提供了不同的選擇,以滿足不同的軟件工程需求,從實驗性的代理開發到商業環境中的實際部署,都能得到有效支持。
huggingface:https://huggingface.co/mistralai/Devstral-Small-2507
劃重點:
🌟 Devstral2507系列包括開源的 Devstral Small1.1和企業版的 Devstral Medium2507,旨在提升代碼推理與自動化能力。
🚀 Devstral Small1.1在 SWE-Bench 基準測試中得分53.6%,而 Devstral Medium2507得分61.6%,後者表現優於一些商業模型。
💼 兩款模型支持與代碼代理框架集成,適用於從本地開發到企業級服務的多種應用場景。