Mistral AI 发布 Devstral2507:为代码中心语言建模而生

近日，Mistral AI 与 All Hands AI 合作，推出了针对开发者的大型语言模型 Devstral2507系列，包含两款新模型:Devstral Small1.1和 Devstral Medium2507。这些模型旨在支持基于智能代理的代码推理、程序合成和结构化任务执行，适用于大型软件代码库的实际应用。这次发布在性能和成本上进行了优化，使其在开发工具和代码自动化系统中具有广泛的应用潜力。

Devstral Small1.1是一款开源模型，基于 Mistral-Small-3.1基础模型，拥有约240亿个参数。该模型支持128k 的上下文窗口，能够处理多文件代码输入和复杂的长提示，符合软件工程工作流程的特点。此版本特别针对结构化输出进行微调，包括 XML 和函数调用格式，使其与 OpenHands 等代理框架兼容，适合程序导航、多步骤编辑和代码搜索等任务。Devstral Small1.1的许可为 Apache2.0，支持研究和商业用途。

在性能测试方面，Devstral Small1.1在 SWE-Bench Verified 基准测试中获得53.6% 的成绩，证明其在为真实的 GitHub 问题生成正确补丁方面表现优异。虽然其性能不及大型商业模型，但在大小、推理成本和推理能力之间找到了一个平衡点，适合多种编码任务。

此外，该模型以多种格式发布，包括可以在高内存 GPU（如 RTX4090）或32GB RAM 以上的 Apple Silicon 机器上进行本地推理的量化版本。同时，Mistral 还通过其推理 API 提供模型，当前的收费标准与 Mistral-Small 系列模型相同。

Devstral Medium2507则仅通过 Mistral API 或企业部署协议提供，并不开放源代码。该模型在 SWE-Bench Verified 基准测试中得分为61.6%，在长上下文的推理能力上表现出色，能够超越一些商业模型，如 Gemini2.5Pro 和 GPT-4.1。此模型的 API 收费标准高于 Small 版本，但其强大的推理能力使其非常适合在大型代码库中执行任务。

Devstral Small 更适合本地开发、实验或集成到客户端开发工具中，而 Devstral Medium 则在结构化代码编辑任务中提供更高的准确性和一致性，适合需要高性能的生产服务。两款模型的设计都支持与代码代理框架的集成，使其能够简化测试生成、重构和错误修复的自动化工作流程。

通过此次发布，Mistral AI 的 Devstral2507系列为开发者提供了不同的选择，以满足不同的软件工程需求，从实验性的代理开发到商业环境中的实际部署，都能得到有效支持。

huggingface:https://huggingface.co/mistralai/Devstral-Small-2507

划重点:
🌟 Devstral2507系列包括开源的 Devstral Small1.1和企业版的 Devstral Medium2507，旨在提升代码推理与自动化能力。
🚀 Devstral Small1.1在 SWE-Bench 基准测试中得分53.6%，而 Devstral Medium2507得分61.6%，后者表现优于一些商业模型。
💼 两款模型支持与代码代理框架集成，适用于从本地开发到企业级服务的多种应用场景。

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公

智谱AI推出革命性PPT生成工具AI Slides，基于最新GLM-Experimental模型开发。用户只需输入主题或上传文档，即可自动生成专业级PPT，包含智能排版、图表设计和视觉优化。该工具适用于商业报告、学术演示等场景，目前完全免费开放体验。社交媒体反馈显示其生成效果媲美专业设计，显著提升办公效率。用户可通过智谱清言官网抢先体验这一智能办公新功能。

谷歌宣布最新一届美国人工智能基础设施学院学员名单

谷歌启动第二届"AI基础设施学院"，为种子轮到A轮AI初创企业提供4个月无股权支持，包括领导力培训等资源。项目采用虚拟模式，优胜者可参加谷歌总部峰会。申请4月底开放，要求企业具备6个月资金储备和市场潜力。去年首届学员表现亮眼，如Cloverleaf AI获280万美元融资。本届入选企业覆盖医疗、教育、供应链等17个领域，包括医疗运输平台MedHaul和RNA疗法研发商CircNova。这是谷歌AI扶持计划的一部分，此前还推出2000万美元"AI未来基金"支持采用DeepMind技术的初创公司。

AWS 在 AI 竞争中加码基础设施，SageMaker 平台迎来重大升级

AWS对SageMaker平台进行重大升级，新增模型可观察性功能和本地IDE连接能力。升级后的SageMaker HyperPod可监控模型训练各环节性能，并支持本地开发环境无缝对接云端。平台还优化了GPU集群管理，实现训练与推理任务的资源灵活调度。AWS通过持续完善AI基础设施，强化其在企业级AI市场的竞争力。

英伟达市值首次突破 4 万亿美元，黄仁勋将与特朗普会面引关注

英伟达CEO黄仁勋将与特朗普会面。近期英伟达市值突破4万亿美元，超越苹果微软成为全球第一。特朗普称赞其股价上涨47%，并主张美联储应降息。但英伟达正面临出口管制困境，因美国限制AI芯片对华出口，预计损失80亿美元订单。黄仁勋警告中国市场封闭将影响美国行业。此次会面或为英伟达寻求政策突破，引发业界关注。

微软 BioEmu 模型实现蛋白质模拟时间大幅缩短

微软发布革命性BioEmu模型，将蛋白质动态模拟时间从数年缩短至数小时。该模型基于AlphaFold2改进，采用序列编码器和扩散生成技术，能生成多样化蛋白质构象。通过200毫秒分子动力学数据训练，显著提升模拟精度。这一突破将极大加速药物研发和生物医学研究，已在《自然》期刊发表。

Mistral AI 发布 Devstral2507:为代码中心语言建模而生

相关推荐

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公

谷歌宣布最新一届美国人工智能基础设施学院学员名单

​AWS 在 AI 竞争中加码基础设施，SageMaker 平台迎来重大升级

​英伟达市值首次突破 4 万亿美元，黄仁勋将与特朗普会面引关注

微软 BioEmu 模型实现蛋白质模拟时间大幅缩短

AWS 在 AI 竞争中加码基础设施，SageMaker 平台迎来重大升级

英伟达市值首次突破 4 万亿美元，黄仁勋将与特朗普会面引关注