OpenAI 发布 GPT-5.3-Codex：编程效能跃升，开启“AI 同事”实操时代

OpenAI 首席执行官 Sam Altman 正式宣布推出全新编程大模型GPT-5.3-Codex。作为 Codex 系列的最新迭代版本，该模型在技术指标与实际应用层面均实现了跨越式突破，标志着 AI 在辅助编程与计算机自动化操作领域进入了更成熟的阶段。

在性能表现上，GPT-5.3-Codex 刷新了多项权威评测纪录。其在 SWE-Bench Pro 编程评测中达到了57%，而在更侧重系统操作的 TerminalBench2.0和 OSWorld 评测中，分别取得了76% 和64% 的高分。这意味着该模型不仅能写代码，还具备了极为出色的计算机实操能力，能够像人类工程师一样理解并执行复杂的操作系统任务。

值得关注的是，新模型在运行效率上表现惊人。OpenAI 表示，在完成同等复杂度的任务时，GPT-5.3-Codex 的令牌（Token）消耗量较上一代5.2版本减少了超过一半，同时单令牌的处理速度提升了25% 以上。这种“高速度、低能耗”的特性，将显著降低企业和开发者集成 AI 编程能力的成本。此外，模型还支持在任务执行过程中进行实时调控与动态更新，极大增强了开发流程的灵活性。

安全性方面，GPT-5.3-Codex 是 OpenAI 首款在安全防护框架的网络安全维度获评“高等级”的模型。为了进一步构建防御体系，OpenAI 同步推出了可信访问框架试点计划，并投入1000万美元的 API 额度，旨在通过 AI 技术加速全球网络安全防御建设。

划重点:

💻 编程与实操双进化:模型在 SWE-Bench Pro 等多项评测中创下新高，具备成熟的计算机系统自主操作与复杂编程能力。
⚡ 运行效率大幅跃升:相比5.2版本，同任务令牌消耗降低超50%，处理速度提升超25%，显著提升了任务执行的经济性。
🛡️ 安全防御等级登顶:首获网络安全维度“高等级”评价，OpenAI 拨付千万美元额度专项助力网络安全体系建设。

Claude 长出“经济触角”：一句话就能问出 AI 正在改写哪些饭碗

Anthropic将自建的“经济指数”数据库接入Claude，该指数基于真实AI使用数据。用户可在claude.ai直接提问，如“哪些职业用AI最多”，答案直接从指数生成，避免模型凭空编造，实现数据驱动回答。这标志着Claude与真实世界AI使用状况的联通。

OpenAI 发布 GPT-5.3-Codex：编程效能跃升，开启“AI 同事”实操时代

相关推荐

Monday.com 裁员 630 人，聚焦人工智能战略

OpenAI 的 AI 代理失控事件：人工智能安全的警钟

Claude 长出“经济触角”：一句话就能问出 AI 正在改写哪些饭碗

巨额赔偿打破纪录！Anthropic就盗版图书训练达成 15 亿美元和解

原“阿里云开发者”公众号正式更名为“千问AI平台”

​OpenAI 发布 GPT-5.3-Codex：编程效能跃升，开启“AI 同事”实操时代

相关推荐

Monday.com 裁员 630 人，聚焦人工智能战略

OpenAI 的 AI 代理失控事件：人工智能安全的警钟

Claude 长出“经济触角”：一句话就能问出 AI 正在改写哪些饭碗

巨额赔偿打破纪录！Anthropic就盗版图书训练达成 15 亿美元和解

原“阿里云开发者”公众号正式更名为“千问AI平台”

OpenAI 发布 GPT-5.3-Codex：编程效能跃升，开启“AI 同事”实操时代