DeepSeek发布V3.1版本，上下文窗口翻倍至128K tokens

北京，2025年8月19日 — DeepSeek今日正式发布其旗舰大语言模型的最新迭代版本DeepSeek-V3.1，该版本在保持完全API兼容性的前提下，将上下文窗口容量从64k tokens大幅扩展至128k tokens，标志着该公司在开源AI技术领域的又一重要里程碑。

技术升级与市场定位

DeepSeek-V3.1距离前一版本DeepSeek-V3-0324的发布仅相隔五个月时间。V3-0324版本于今年3月发布，在推理能力、编程效率和数学计算等核心性能指标方面实现了显著提升，为本次V3.1版本的进一步优化奠定了坚实基础。

在当前全球AI技术竞争日趋激烈的背景下，DeepSeek的快速产品迭代策略充分展现了其技术创新能力和市场响应速度。尽管面临国际制裁带来的高端计算资源获取限制，DeepSeek依然通过创新的高效训练方法和优化策略，在开源大语言模型领域保持了强劲的竞争优势。

扩展上下文处理能力:V3.1版本的核心升级在于上下文窗口的翻倍扩容，使模型能够处理更长的多轮对话序列和复杂的查询任务，为用户提供更连贯和深入的交互体验。

优化输出结构:根据早期用户反馈，V3.1在语言表达风格方面进行了显著优化，模型现在更倾向于生成结构化输出内容，包括表格、列表等格式化数据呈现，提升了信息的可读性和实用性。

增强物理理解能力:新版本在物理现象模拟和相关概念理解方面表现出明显改进，为科学计算和工程应用场景提供了更强的支撑能力。

架构延续与优化:V3.1继续采用经过验证的专家混合（MoE，Mixture of Experts）架构设计，针对常规推理任务进行了专门优化，在此类应用场景下无需启用"DeepThink"深度思考模式，既保证了处理效率又维持了输出质量。

DeepSeek-V3.1目前已在多个平台同步上线，包括DeepSeek官方网站、移动应用程序以及微信小程序等主要用户接入渠道。该公司特别强调了API接口的完全向后兼容性，确保现有用户和开发者能够无缝迁移至新版本，无需修改现有的集成代码或调用方式。

虽然截至发稿时，Hugging Face平台尚未提供V3.1版本的模型权重文件下载，但DeepSeek重申了其对开源社区的长期承诺，承诺将继续遵循开源发布策略，为全球AI研究社区和开发者提供技术支持。

DeepSeek-V3.1的发布进一步巩固了该公司在中国AI技术创新领域的领先地位，也为全球开源大语言模型的发展贡献了重要的技术进步。随着上下文处理能力的显著提升和多项性能优化的实现，V3.1有望在企业级应用、学术研究和个人用户场景中发挥更大的价值。