科技媒体Ars Technica于 4 月 30 日发布的一则报道引发了AI圈的广泛关注。在最新开源的Codex CLI代码中,OpenAI旗下GPT-5. 5 模型的系统提示词意外曝光,其中包含一条极为古怪的指令:严禁在对话中谈论“哥布林”及“小精灵”等幻想生物

image.png

神秘禁令防范AI陷入特定幻觉

这份长达 3500 多词的基础指令集显示,除非用户查询存在绝对明确的关联性,否则GPT-5. 5 明确禁止讨论哥布林、小精灵、浣熊、巨魔及鸽子等生物。令人费解的是,这一禁令在指令中重复出现了两次,其权重与“禁止执行破坏性命令”等常规准则并列。

技术专家分析认为,这并非某种营销噱头,而是针对特定技术漏洞的“补丁”。近期有大量用户反馈,GPT在处理无关话题时,会莫名其妙地在输出内容中反复提及哥布林。这种针对性的指令,极有可能是为了抑制新模型在生成过程中产生的不稳定性幻觉。

模型迭代中的控制策略升级

对比早期的模型文件可以发现,这种对特定生物的禁令是GPT-5. 5 版本中特有的现象。OpenAI工程师对此表示,这反映了大型语言模型在处理复杂逻辑时,可能会对某些词汇产生异常的偏移倾向,必须通过底层指令进行强行干预。

尽管这一特殊的“补丁”已经演变成社交媒体上的热门话题,但它也暴露出大模型在精细化控制上的挑战。随着GPT-5. 5 逐步推向市场,如何平衡模型的创造力与逻辑稳定性,依然是OpenAI工程师们需要解决的核心难题。