OpenAI正式发布全新基础模型GPT-5.4,旨在打造目前功能最强且效率最高的专业工作前沿模型。据 AIbase 报道,该系列此次采取了差异化发布策略,除标准版外,同步推出专注于复杂逻辑的推理模型 GPT-5.4Thinking,以及针对高性能需求优化的 GPT-5.4Pro

ChatGPT

技术层面,GPT-5.4的 API 版本实现了飞跃,提供高达 100万个标记(Tokens)的上下文窗口,为 OpenAI 史上之最。与此同时,该模型显著提升了令牌效率,能以更少的资源消耗解决同类问题。

在安全性与准确性上,新模型较 GPT-5.2的单个陈述错误率降低了33%,整体回复错误率下降18%。此外,针对推理模型可能存在的“思维链欺骗”风险,OpenAI引入了全新的安全评估系统,测试表明GPT-5.4Thinking具备更高的透明度,难以隐藏或伪造其推理过程。

在实测基准测试中,GPT-5.4表现强劲,不仅在 OSWorld-Verified 和 WebArena Verified 等计算机使用测试中刷新纪录,更在知识工作任务 GDPval 测试中取得83% 的创纪录高分

Mercor 首席执行官 Brendan Foody 指出,该模型在金融、法律等专业领域的APEX-Agents基准测试中同样处于领先地位,尤其擅长生成财务模型、法律分析等长期交付成果。配合全新的“工具搜索”系统,模型在调用外部工具时更具效率,大幅降低了大规模工具集成下的令牌损耗。