法國初創公司 Mistral 再次引發關注,他們與開源團隊 All Hands AI 合作推出了全新語言模型 Devstral。這一模型不僅擁有240億個參數,而且所需的計算資源顯著低於許多同類產品,使其成爲本地部署及設備端使用的理想選擇。對於那些擁有 RTX4090顯卡或32GB 內存的用戶而言,Devstral 可以輕鬆運行,帶來了更加靈活的使用體驗。
在開源社區的聲望逐漸提升的背景下,Mistral 通過 Devstral 向開發者們證明了他們的實力。儘管該公司的 Medium3大模型曾因未開源而受到批評,但此次的開放態度讓人倍感振奮。Devstral 遵循寬鬆的 Apache2.0許可證,允許開發者和組織自由地進行修改、部署和商業化,這將爲衆多項目帶來新的可能性。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
Devstral 的設計初衷是解決現實世界的軟件工程難題。雖然許多大型語言模型在編程任務中表現出色,如編寫獨立函數或進行代碼補全,但它們在處理複雜代碼庫的上下文關聯上卻顯得力不從心。Devstral 則專注於這一領域,能夠有效解決真實的 GitHub 問題,併兼容 OpenHands 和 SWE-Agent 等代碼智能體框架。
根據頂級軟件工程基準測試 SWE-Bench Verified,Devstral 的表現相當出色,得分爲46.8%,遠超其他開源模型,甚至領先於一些閉源模型,如 GPT-4.1-mini,足足高出20個百分點。這一成績展示了 Devstral 在實際編程能力上的潛力。
在同一測試框架下,Devstral 的表現也超過了許多參數更爲龐大的模型,如 Deepseek-V3-0324和 Qwen3232B-A22B。其顯著的效率和優越的性能讓開發者們對其讚不絕口。
此外,Devstral 還可通過 Mistral 的 Le Platforme API 訪問,定價爲每百萬輸入 Token0.10美元,每百萬輸出 Token0.30美元,極具性價比。