OpenAI 首席执行官 Sam Altman 正式宣布推出全新编程大模型GPT-5.3-Codex。作为 Codex 系列的最新迭代版本,该模型在技术指标与实际应用层面均实现了跨越式突破,标志着 AI 在辅助编程与计算机自动化操作领域进入了更成熟的阶段。

image.png

在性能表现上,GPT-5.3-Codex 刷新了多项权威评测纪录。其在 SWE-Bench Pro 编程评测中达到了57%,而在更侧重系统操作的 TerminalBench2.0和 OSWorld 评测中,分别取得了76% 和64% 的高分。这意味着该模型不仅能写代码,还具备了极为出色的计算机实操能力,能够像人类工程师一样理解并执行复杂的操作系统任务。

值得关注的是,新模型在运行效率上表现惊人。OpenAI 表示,在完成同等复杂度的任务时,GPT-5.3-Codex 的令牌(Token)消耗量较上一代5.2版本减少了超过一半,同时单令牌的处理速度提升了25% 以上。这种“高速度、低能耗”的特性,将显著降低企业和开发者集成 AI 编程能力的成本。此外,模型还支持在任务执行过程中进行实时调控与动态更新,极大增强了开发流程的灵活性。

安全性方面,GPT-5.3-Codex 是 OpenAI 首款在安全防护框架的网络安全维度获评“高等级”的模型。为了进一步构建防御体系,OpenAI 同步推出了可信访问框架试点计划,并投入1000万美元的 API 额度,旨在通过 AI 技术加速全球网络安全防御建设。

划重点:

  • 💻 编程与实操双进化:模型在 SWE-Bench Pro 等多项评测中创下新高,具备成熟的计算机系统自主操作与复杂编程能力。

  • 运行效率大幅跃升:相比5.2版本,同任务令牌消耗降低超50%,处理速度提升超25%,显著提升了任务执行的经济性。

  • 🛡️ 安全防御等级登顶:首获网络安全维度“高等级”评价,OpenAI 拨付千万美元额度专项助力网络安全体系建设。