一场围绕AI“货币”——Token的贴身肉搏,正在阿里与字节之间全面引爆。
年初,字节跳动凭借豆包大模型和抖音生态,一度主导了Token的叙事权。如今,轮到阿里巴巴全面反攻了。据《中国企业家》独家获悉,阿里在4月制定了一项名为“530 Token战役”的激进计划:以MaaS为核心,到5月底前Token收入较4月初翻5倍,年底再翻30倍。截至5月15日,该任务已超额完成。

为了达成目标,阿里云向一线销售开出了前所未有的激励:每卖出1万元Token,给予1:1的绩效奖励。有销售打趣:如果从字节挖来一个大客户,奖励金额可以直接提一辆车。同时,阿里云鼓励第三方合作伙伴用Agent产品一起卖Token,产品中MaaS消耗占比越高,奖励系数越高——100元营收中含5元MaaS消耗,合作伙伴在阿里云抽成30%之外,还能获得1.5倍的系数奖励。
字节的增长同样惊人。截至今年3月底,豆包大模型日均调用量突破120万亿Tokens,三个月翻了一倍。由于抖音生态和Seedance 2.0视频模型的带动,火山引擎在第一季度就完成了全年Token收入指标的10倍。
然而,阿里选择了一条差异化的进攻路线。字节拥有强大的C端入口,销售可以“躺赢”;阿里则从B端办公和编程场景切入,瞄准企业级市场。阿里CEO吴泳铭在财报电话会上表示:“只要AI创造的价值大于Token成本,企业对API Token的需求就是无限的。”
在Token消耗最高的具身智能赛道,一位阿里云高层走访了30多家创业公司,让大部分用上了Qwen开源模型,理由很简单:开源、迭代快、尺寸多样。加上阿里已投资自变量、宇树科技、逐际动力等企业,形成了“投资+模型+云”的绑定效应。
视频生成领域同样火药味十足。当字节Seedance 2.0的代理费涨至1000万元时,阿里的欢乐马(HappyHorse)直接将API代理费砍到500万元,用“打骨折”的价格挖字节墙角。
结果立竿见影:2026年前5个月,阿里云MaaS业务Token收入增长了15倍。据一季度财报,包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入(ARR)将突破100亿元,年底目标300亿元。
4月,阿里Qwen大模型负责人林俊旸离职引发外界担忧。但仅一个月后,阿里在5月20日的云峰会上发布了Qwen3.7 Max,节奏丝毫未乱。
据Qwen核心技术负责人刘大一恒介绍,Qwen3.7 Max经过超8000个环境的强化学习训练,已超越国内所有模型,仅与Anthropic存有微小差距。阿里云现场演示了该模型的超强长程任务能力:从0到1编写一个记单词App,自主运行超1万行代码,耗时11小时完成,最终支持1000多用户流畅使用。更令人惊讶的是,Qwen3.7 Max还能控制物理世界的机器狗寻找物品,将语言模型与视频生成、具身智能串联起来。
在生态层面,阿里采取了完全开放的战略。5月20日的阿里云峰会上,智谱、月之暗面、MiniMax、阶跃星辰、爱诗科技、生数科技等头部AI厂商悉数到场,共建“百炼开放模型”服务——除阶跃星辰外,其余均获得阿里系投资。对于没有与字节深度合作的大模型厂商,阿里云会“砸”资源:云服务、投资、生态合作全面倾斜。
字节则坚持闭源模型策略,对头部大模型公司鲜有投资,更多依靠自身生态闭环。两种方法论、两种体系的对抗,在Token战场上愈演愈烈。
Token大战的底层是算力效率。5月20日,阿里平头哥发布了两款芯片:训推一体的AI芯片“真武890”和ICN Switch互联芯片,搭载于AL128超节点(128张真武890芯片)。与华为384超节点的光连接方案不同,AL128采用高速电互连,成本更低、稳定性更高,且兼容主流芯片。平头哥还布局了倚天CPU、磐脉智能网卡、镇岳存储主控等全栈芯片,目标直指Infra层的整体Token输出效率。
一位投资人指出:“大模型竞争到最后,不是参数规模的竞争,也不是算法的竞争,而是Infra层,尤其是芯片、互联和算力的整体Token输出效率。”阿里云已从底层芯片到Agentic Cloud、从模型矩阵到服务平台再到Agent应用,成为国内唯一完整打通五层全栈能力的云厂商。
当字节用抖音流量“躺赢”时,阿里选择用高额激励、开源生态、全栈自研和价格战贴身肉搏。两家巨头的Token对攻,已经从销售补贴蔓延到模型能力、生态合作、芯片基础设施的全面“集团战”。
对于企业客户而言,这无疑是一场红利期——Token正在变得越来越便宜,越来越易得。而对于阿里和字节,谁能率先实现“Token收入规模化”,谁就将掌握下一代AI经济的定价权。