Mistral 公司近日宣佈升級其開源代碼生成模型 Codestral,推出了全新版本 Codestral25.01。此次更新使得該模型在編程領域的競爭力顯著增強,目標是爲開發者提供更高效的代碼生成體驗。

根據 Mistral 的博客文章,Codestral25.01的架構經過優化,承諾在同類模型中成爲 “絕對領軍者”,其代碼生成速度是之前版本的兩倍。這一新版本依舊保持了原有模型的優勢,專注於低延遲和高頻操作,支持代碼糾正、測試生成及代碼填充等任務。Mistral 表示,這對於擁有大量數據的企業和模型駐留使用場景尤爲重要。

在各項基準測試中,Codestral25.01在 Python 編碼測試中表現優異,在 HumanEval 測試中取得了86.6% 的高分,超越了之前版本的 Codestral、Codellama70B Instruct 和 DeepSeek Coder33B Instruct。
開發者可以通過 Mistral 的 IDE 插件合作伙伴來使用 Codestral25.01。此外,用戶還可以通過 Mistral 的平臺和 Google Vertex AI 訪問該模型的 API,目前該模型在 Azure AI Foundry 上提供預覽,並將在 Amazon Bedrock 上上線。

自2023年5月首次發佈 Codestral 以來,Mistral 便不斷推動其產品的升級與創新。之前推出的 Codestral-Mamba 模型基於 Mamba 架構,能生成更長的代碼字符串並處理更多輸入。值得注意的是,Codestral25.01在 Mistral 發佈公告後的幾個小時內,就已迅速攀升至 C o p i l ot Arena 的排行榜上,顯示出市場對這一新模型的強烈興趣。
編寫代碼作爲基礎模型的早期功能之一,儘管在通用模型如 OpenAI 的 o3和 Anthropic 的 Claude 中也有應用,但在過去一年中,專注於編程的模型已經取得了顯著進步,常常能超越一些大型通用模型。近期,阿里巴巴、DeepSeek Coder 和微軟也相繼發佈了新的編程模型,競爭愈發激烈。
在衆多開發者中,對於選擇通用模型還是專注於編程的模型仍存在爭議。有些開發者更傾向於使用像 Claude 這樣的通用模型,而對於編程任務的需求則推動了專用模型的不斷涌現。由於 Codestral 專門針對編碼數據進行訓練,因此在編程任務上的表現自然更爲優異。
官方博客:https://mistral.ai/news/codestral-2501/
劃重點:
🌟 Mistral 推出 Codestral25.01,代碼生成速度提高至前版本的兩倍。
💻 該模型在 Python 編碼測試中表現優異,獲得86.6% 的 HumanEval 測試分數。
📈 Codestral25.01迅速在 C o p i l o t Arena 中升至榜首,受到開發者廣泛關注。
