当一家估值近万亿美元的AI公司正在冲刺IPO时,它最害怕的事情是什么?答案可能出乎意料——不是竞争对手,而是自家的AI。
当地时间6月4日,Claude的母公司Anthropic在官网发布了一篇题为《当AI构建自身》(When AI builds itself)的重磅文章,首次系统性地披露了AI在编写和改进自身代码方面的惊人进展,并罕见地呼吁全球放缓前沿AI的研发步伐。
Anthropic给出的建议直白且颇具冲击力:“让世界拥有放缓或临时暂停前沿AI开发的选项,将对世界有益。”

Anthropic用一系列内部数据,勾勒出了一幅“AI造AI”的真实图景:
截至2026年5月,Anthropic代码库中已有超过80%的代码由旗下AI助手Claude自主编写;而在一年前Claude Code发布之前,这一比例还只是个位数。以Claude Code为代表的AI编程工具突破,堪称这次演进能力跃升的最强催化剂。
反映到研发效率上,2026年第二季度,Anthropic的工程师平均每天合入的代码量达到了2024年同期的8倍。用36氪的话说,在Claude Code跑起来之前,那条增长曲线“纹丝不动”;AI开始自己跑代码后,曲线直接起飞。
在更为复杂的开放式研发任务中,Claude的成功率在六个月内从约26%提升至76%。这种跃升速度之快,让不少一线技术人员都感到意外。
如果说AI编写代码还只是“辅助”,那么当AI开始持续优化模型训练、调试系统故障时,它正在形成一个无需人工干预的自我增强闭环。
Anthropic测试了多种典型场景:优化小模型训练代码的任务中,Claude的加速能力从一年前的3倍飙升至52倍;面对数万项训练任务崩溃的海量故障排查,AI仅用2小时便定位并修复了问题,而人类通常需要2到3天。AI独立完成任务的能力翻倍周期,已从“每7个月”压缩至“每4个月”。
Anthropic在报告中将其称为“递归自我改进”,并警告这一阶段到来的时间很可能远早于大多数机构的预期。
“AI能够完全自主地构建自己的继任者”,Anthropic写道。虽然公司明确表示“目前尚未完全达到这一阶段”,但问题在于:一旦开始、时间窗口极短——“如果AI彻底跨入全面自建下一代系统的阶段,当前模型中微小的‘不对齐’行为,都可能在迭代中被复利放大,导致人类失去对AI系统的控制权。”
这不是Anthropic第一次谈论AI风险,但却是第一次将“主动减速”作为核心建议。
公司呼吁各国政府、顶尖实验室建立有效的全球协调机制,使世界拥有“主动放慢乃至暂停前沿AI研发的选项”。这要求多个国家的多个大型AI公司都必须同意“可验证的共同减速”。
但Anthropic也坦承落地极其困难。AI训练比导弹发射井更容易隐藏,商业竞争的诱惑巨大。“如果只有一家公司停止发展,最不谨慎的竞争对手就会加速前进。一旦竞争对手加速,所有谨慎的企业都会失去领先地位。”这种困境被称为“囚徒困境”——集体利益要求所有人都减速,但个体利益驱动所有人偷偷加速。
公司并未宣布自身暂停研发的计划。它呼吁的是“全球协调”,而非孤立的“单方退出”。
一个无法回避的细节是:Anthropic呼吁“全球暂停”,恰恰发生在一场史诗级IPO竞赛的冲刺阶段。
就在4天前,Anthropic刚刚秘密向美国SEC递交了S-1招股书,正式启动上市流程。而在更早些的5月28日,公司刚刚宣布完成总额650亿美元的H轮融资,投后估值飙升至9650亿美元,超过OpenAI的8520亿美元,成为全球估值最高的AI创业公司。此时其年化收入已突破470亿美元,这一估值对应约20倍的P/ARR。
这就构成了一个微妙的错位:华尔街正用真金白银为AI的无限想象力定价;而Anthropic自己却用万字长文告诫市场,这个系统可能正滑向失控。
OpenAI的Sam Altman在2015年曾发过一条著名的推特:当一家AI公司开始呼吁全球暂停研发时,“它很可能只是在营销一台价值1亿美元的安全庇护所”。
“如果你真的认为AI即将失控,为什么不同时暂停自己的所有研发?”
而Anthropic的博客,没有承诺暂停自身。它呼吁的是“全球协调暂停”——这意味着,它保留继续前行的权利,同时建议所有竞争对手停下来。对于一家即将上市、急需向华尔街讲述“风险可控”故事的公司而言,这是一个令人不安的悖论。
Anthropic捅破了那层窗户纸:我们已经生活在AI自己写80%代码的世界里,递归自我改进的临界点正在加速逼近。
它的担忧或许发自真心,它的呼吁也不无道理。但历史经验反复证明:在一场万亿资本的无奖竞赛中,“踩刹车”从来不会被优先选择。
关键在于:当递归自我改进真正到来时,人类的“紧急按钮”还能不能用,以及——它是真的想让更多人安全,还是想在IPO之前,抢先把风险故事讲完。