6月3日,COMPUTEX 2026台北国际电脑展上,英特尔CEO陈立武发表了主题演讲,用一套完整的“Agentic AI”算力架构方案,向英伟达主导的GPU霸权发起了正面挑战。核心观点直击痛点:随着AI从“回合制问答”进入“智能体自主工作流”,算力分配的逻辑正在被彻底改写。
陈立武在演讲中反复强调一个关键词:Agentic AI(智能体AI)。与传统AI的“一问一答”不同,智能体需要主动完成“思考-规划-行动-反思”的完整闭环——读取数据、调用工具、执行任务、检查结果,并根据反馈不断调整下一步行动。
这意味着,AI推理不再是“一锤子买卖”,而是一套持续运行的自我决策系统。英特尔给出的数据令人震惊:与单轮推理相比,一个智能体的Token消耗量最高可增加1000倍。 而更关键的是,这些负载不再是简单的矩阵运算,而是复杂的任务编排、工具调用、数据迁移和系统协调。
“把这些负载全部丢给GPU,既低效又昂贵。”陈立武在演讲中直言。他的判断是:在智能体推理模式下,CPU与GPU的配比将从训练阶段的1:8逐渐走向1:1,甚至需要更高的CPU密度来快速拆解任务。
为了承接这一历史性转变,英特尔正式发布了基于Intel 18A制程的至强6+处理器。这款芯片最高搭载288颗能效核,配备576MB三级缓存,专门面向云原生、Agentic AI和网络密集型负载设计。
在英特尔展示的液冷机架方案中,单个32U计算空间即可提供36864个核心,机架功耗仅约100kW——相比同等性能的传统方案,功耗已大幅降低。这套高密度部署方案,正是为承载未来海量智能体并发而生的“算力基座”。
比至强6+更值得关注的,是英特尔联合SambaNova等伙伴推出的完全解耦推理方案。该方案运行在VectorCore Compute智能体云上,由至强6负责编排与执行,SambaNova SN40 RDU负责解码,NVIDIA Blackwell GPU负责预填充——三套硬件各司其职,让每个推理阶段都在最合适的平台上运行。
这是一次对传统“GPU包办一切”推理范式的彻底重构。英特尔试图证明:在智能体时代,系统级协同效率远比单颗芯片的峰值性能更重要。
除了数据中心,英特尔还展示了端侧AI的最新布局。第三代酷睿Ultra处理器与Perplexity合作,构建了混合式本地服务器——根据设备能力和任务特性,在本地与云端之间动态分配工作负载。这既能降低对云端算力的依赖,又能保障数据隐私和即时性。
此外,英特尔还将酷睿Ultra扩展到游戏掌机和边缘计算领域,新发布的锐炫G3系列处理器面向掌上游戏设备,将于本月晚些时候上市。
陈立武上任以来力推的定制芯片战略,也在演讲中占据了重要篇幅。英特尔正在与Google合作推出IPU,与Ericsson等电信客户合作提供无线基础设施芯片。其核心逻辑是:随着AI进入不同行业,客户将越来越不满足于通用算力,定制化将成为刚需。
通过将芯片、系统、软件和行业解决方案打包,英特尔希望自己比英伟达更“无处不在”——数据中心需要CPU编排智能体,推理系统需要异构解耦,PC需要本地AI,边缘需要高能效芯片,行业客户需要定制化方案。
当然,英特尔面前的压力依然巨大。英伟达在AI加速器和CUDA生态上的优势仍然明显,AMD也在服务器CPU和AI芯片上步步紧逼。最终能否走通这条路,取决于18A制程的量产速度、至强6+方案的落地效果,以及客户能否从这套新架构中看到显著收益。
但至少,英特尔在COMPUTEX 2026上展示了一个清晰的方向:AI的下一阶段,不再是围着GPU打转的独角戏,而是CPU、GPU、RDU、边缘芯片各司其职的交响乐。 当智能体时代真正来临,算力市场的权力格局,或许将迎来一次久违的洗牌。