Anthropic 推出 Claude Opus4.5:迈向更高智能与效率的混合推理模型

人工智能公司 Anthropic 正式发布其最新旗舰模型 Claude Opus4.5。根据公司官方介绍，该模型在编码（coding）、agent(智能代理)操作及电脑使用等关键生产力场景中，已达当前世界领先水平，同时在研究、演示文稿、电子表格等常见任务上也有显著提升。

核心能力:编码、推理与长期任务管理

软件工程能力显著提升

在真实世界的软件工程测试中，Opus4.5达到了极高的性能标准。Anthropic 表示它在复杂、多系统的 Bug 修复任务中，能自己推理出修复方案，无需过度引导。在 Terminal Bench 测试中，该模型比前代 Sonnet4.5多出约15% 的表现。开发者反馈指出，Opus4.5在代码迁移、重构方面尤其擅长，并且推理路径更加复杂但高效。

长期工作与自动化 Agent

Opus4.5支持较长上下文（context）窗口，据官方页面为 200K tokens。（Anthropic）

Anthropic 在开发平台中新增了 “effort 参数”，允许开发者调整模型的计算强度:可以为了速度和成本节省降低 “思考”强度，也可以提升质量以追求最优输出。

它在多智能体（multi-agent）任务中表现尤为出色。Anthropic 的评估显示，该模型在复杂 agent 系统里协调子 agent 的能力提升，从而显著提高任务完成质量与效率。

常规办公室与生产力工具能力增强

在 Claude 应用端，长对话不再容易触达上下文极限:模型会自动总结早期内容，以维持对话连续性。 Chrome 扩展首次全面开放给 Max 用户;此前仅为试用状态。Excel 集成功能也有更新:Opus4.5在内部评估中，在复杂财务建模和自动化任务上的准确率提升约20%，效率提升约15%。

在 Claude Code 桌面版中，用户可并行运行多个会话（例如分别用于调试、文档编写、测试等 Agent 任务），并且 Plan Mode(规划模式)进一步增强:模型会在正式执行之前提出一个可编辑的计划文件(如 plan.md)，并向用户澄清问题。 (Anthropic)

性能与效率改善:更强、更省、更灵活

Opus4.5在多项内部基准测试中表现优异，涵盖编码（SWE-bench）、agent 能力 (τ²-bench)、推理、数学和视觉等多个维度。在效率方面，新模型显著减少 token 使用。例如，在某些设置下，通过调节 effort 参数，Opus4.5可以在保持或超过 Sonnet4.5性能的同时，输出 token 数减少达 76%。

此外，通过上下文压缩（context compaction）和 memory 管理提升，它能更稳健地长期运行，适合大型、持续性的 agent 工作流。

安全性:对齐与鲁棒性双重加强

Anthropic 表示，Opus4.5是迄今为止 对齐性（alignment） 最强、最稳健的前沿模型之一。在抵抗恶意提示注入（prompt injection）攻击方面，Opus4.5的防御能力优于此前版本。Anthropic 称其比行业内其他前沿模型更难被误导。安全评估覆盖范围广泛，包括主动和被动的风险路径。完整的评估结果与方法被记录在 Opus4.5的 “system card” 中。

定价、可用性与开放平台

价格:通过 Claude API 调用 Opus4.5的费用为 每百万输入 tokens5美元，每百万输出 tokens25美元。

可用性:该模型已在 Anthropic 自家的应用中上线，并且通过 API 对开发者开放。同时，它可在 三大云平台 （Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry）使用。

使用限制变更:对于拥有 Opus 访问权限的用户（如 Max、Team Premium 等），Anthropic 已经移除以前对 Opus 模型的使用 “封顶 (cap)” 限制，并提升了总体使用额度，以便更广泛地应用于日常工作。

影响

工程师与开发者:Opus4.5在编码、调试、重构、大型多 agent 协作方面表现出色，可能显著提高软件开发效率，降低人工反复干预。
企业与办公自动化:借助 Excel、Chrome 等工具集成，企业可以更轻松地将 AI 嵌入日常办公流程，加速分析与自动化。
AI 代理（Agent）生态:更强的长期推理能力与 memory 管理，有望推动复杂、长周期 agent 的落地（如流程自动化、客户服务、研发助理等）。
安全可信:Anthropic 强调对齐（alignment）和对抗攻击 (robustness) 的提升，有助于在高责任场景 (如企业、关键任务) 中增强信任。

Claude Opus4.5是 Anthropic 在 AI 能力与安全性方面的重大进展。它不仅在编码和智能代理任务上展现了领先能力，而且通过更高的效率、更灵活的资源使用方式，以及更稳健的对齐机制，为开发者和企业用户提供了更强大的生产力工具。随着其在云平台上的广泛可用性，Opus4.5有望成为推动下一代 AI 驱动工作流的中坚力量。

Anthropic 推出 Claude Opus4.5:迈向更高智能与效率的混合推理模型

相关推荐

ChatGPT周活用户逼近 10 亿大关：晚了 7 个月，但上线不到四年

1100 多名 AI 员工联名呼吁美国政府踩刹车，奥尔特曼罕见表态支持

苹果系统更新首次点名感谢AI：Claude、Codex联手揪出多项漏洞

AI让漏洞发现速度飙升，今年安全缺陷数量预计翻番，黑客也在加速跟上

国产 GPU 再添一员猛将：摩尔线程拉起 2.8 万亿参数 Kimi K3，MUSA 栈跑通开源巨模型