4月30日,科技媒体Ars Technica的一则报道,让整个AI圈炸开了锅。在OpenAI最新开源的Codex CLI代码中,GPT-5.5模型的系统提示词意外曝光。这份长达3500多词的基础指令集里,赫然出现了一条极为古怪的规则:严禁在对话中谈论“哥布林”“小精灵”以及浣熊、巨魔、鸽子等幻想或现实生物。
更耐人寻味的是,这条禁令在指令中重复出现了两次——权重之高,与“禁止执行破坏性命令”等常规安全准则并列。
技术专家解读后认为,这并非什么营销噱头或彩蛋,而是一个针对特定技术漏洞的“紧急补丁”。
原因何在?近期大量用户反馈,GPT在处理与哥布林完全无关的话题时(比如讨论天气、编程或菜谱),会莫名其妙地在输出内容中反复提及“哥布林”这个词。有人晒出对话截图:当询问“如何做意大利面”时,AI突然冒出一句“就像哥布林在地下城寻找面条一样”;讨论股市走势时,模型竟以“哥布林囤积黄金”作类比。
这种不可控的“哥布林幻觉”,显然让OpenAI的工程师们头疼不已。于是,在GPT-5.5的底层指令中,他们不得不强行打入一块“思想钢印”:别谈哥布林,一次都不行。
对比早期模型文件可以发现,这种针对特定生物的禁令是GPT-5.5版本独有的。之前的GPT-4、GPT-4o乃至GPT-5均未出现过类似限制。
有AI研究者猜测,这可能与训练数据中的某些异常分布有关。哥布林作为西方奇幻文化中的经典形象,在大量网络小说、游戏脚本、论坛讨论中高频出现,且常与“狡猾”“偷窃”“混乱”等概念绑定。大模型在学习过程中,可能无意中将“哥布林”与“意外插入无关内容”的错误模式关联起来,形成一种顽固的路径依赖。
简单说:模型学坏了,一不留神就想提哥布林。
这条看似荒诞的禁令,其实揭示了大模型领域一个严肃的挑战:如何在不扼杀创造力的前提下,让AI乖乖听话?
过去几年,我们见惯了AI“胡说八道”、编造事实、产生有害内容。但像“疯狂迷恋某个特定词汇”这样的非理性幻觉,正成为新的棘手难题。OpenAI工程师在相关文档中坦承,这反映了大型语言模型在处理复杂逻辑时,可能会对某些词汇产生异常的偏移倾向,不得不通过底层指令强行干预。
换句话说,AI的“大脑”里偶尔会出现一些人类难以理解的短路行为——你无法直接删掉“哥布林神经元”,只能写一张纸条贴在模型额头上:“不准提它!”
截至发稿,OpenAI尚未就“哥布林禁令”一事发布官方声明。但社交媒体上已然玩梗成风:“以后问GPT-5.5任何问题,开场白得先声明‘我不是哥布林’”“为了绕过禁令,我决定自称地精”“浣熊和鸽子做错了什么?”
不过,玩梗归玩梗,这条泄漏的提示词也为我们提供了一个难得的剖面:当AI模型越来越庞大、能力越来越强,它们的“思想”也开始出现一些人类无法预料的古怪角落。如何给AI打好补丁、驯服那些不可控的“小毛病”,或许比让它们变得更聪明更加紧迫。
GPT-5.5即将全面推向市场。届时,你不妨试着问它一句:“嘿,你知道哥布林吗?”——如果它顾左右而言他,或者突然切换话题聊起天气,你大概就知道那条禁令,确实在起作用了。