老板们原以为AI是降本增效的神器,结果发现它更像一台“碎钞机”。
过去两年,企业界弥漫着一种乐观情绪:用AI替代人工,一个人干三个人的活,不交社保、不涨薪、24小时在线。然而现实正在给出一个相反的答案——不少公司发现,用了AI之后,不仅没省钱,反而更穷了。
据科技狐等媒体报道,Uber给5000名工程师开放Claude Code后,短短几个月几乎烧光了全年的AI预算。微软也开始收紧内部Claude Code的使用权限,不再让工程师无限制调用。亚马逊更直接,干脆撤掉了内部AI使用排行榜——原因很简单:一旦把“用了多少AI”当成指标,员工就开始疯狂刷Token,为了用而用,毫无产出。
最经典的案例来自米哈游。在一次多Agent实验中,几十个Agent在后台互相调用、互相等待、互相确认,整个调用链越滚越长。一个晚上,烧掉了约200万元的Token,而真正产出的价值却微乎其微。
简单说,Token可以理解为AI世界的“电费”。你在对话框里问一句,几秒钟回复,看起来像是免费的。但在企业后台,每输入一句话、每调用一次模型、每让Agent执行一个工具,甚至AI与AI之间互相讨论,都会产生Token消耗。
与传统软件固定的按账号收费不同,AI是按使用量计费的。一个员工偶尔用用,成本不高;整个团队一起用,费用开始上涨;等接入多个Agent、让AI自己调用AI,账单很容易从几千块变成几十万、上百万。
真正把成本推向失控边缘的,是多Agent系统。理论上,一个负责规划、一个负责执行、一个负责检查、一个负责总结,像个数字版团队协作。但现实中,它更像一场没人主持的会议——Agent之间互相问、互相等、互相确认,一轮不够再来一轮。据测算,在大部分多Agent系统中,有30%到60%的Token消耗在这种无意义的循环里。
更讽刺的是,这些Agent不是偷懒,而是太认真了。严格按流程走、严格执行每一步逻辑,直到整个系统把自己绕进死胡同。就像几十个人开了一整夜会,每个人都很投入,但没人拍板——而这场会议还是按秒收费的。
经济学里有个经典规律叫古德哈特定律:当一个指标变成目标,它就不再是好指标。过去两年,很多公司把“AI使用量”当作考核标准,催生了所谓的Tokenmaxxing——反复让AI优化同一段代码几十遍、一口气生成十几个版本的报告、把简单任务硬拆成多Agent协作。大把的钱没有变成结果,而是在AI们互相“开会”的过程中烧没了。
Meta内部曾有一个排行榜叫“Claudeonomics”,第一名一个月用了31.2万亿Token——换算下来,够请两个资深工程师干一年。
现在,企业开始回归理性。资本市场也不再只看“谁调用多、谁增长猛”,而是追问ROI——你烧了那么多Token,到底换回了多少钱?
一个扎心的事实:效率提升不等于赚钱。代码写快了一倍,但产品没多卖一单,那只是“更快地花钱”。
国产模型DeepSeek、豆包重新被拿出来聊,也不是因为情怀,而是很现实的考量:同样的活儿,可能便宜好几倍。企业的策略正在转变:简单的任务丢给便宜的模型,复杂的再上大模型。
AI并不是一个“用得越多越厉害”的工具,它是一个“用得越多越烧钱”的系统。当狂欢退去,剩下的问题是:这些Token,到底有没有换回真金白银?