一场中美AI巨头的能力赛跑,在初冬的11月13日同时上演。
北京时间11月13日,百度世界大会上,百度正式发布原生全模态大模型文心大模型5.0,其参数量高达2.4万亿,成为业界已公开参数的模型中规模最大的大模型。
同一天,OpenAI低调推出GPT-5.1,而百度文心5.0以“原生全模态”的技术路线正面对垒。
在40余项权威基准评测中,文心5.0的语言与多模态理解能力已与Gemini-2.5-Pro、GPT-5-High等全球顶尖模型持平。百度创始人李彦宏在大会上表示:“智能本身是最大的应用,而技术迭代速度是唯一的护城河。”
01 技术跨越:揭秘文心5.0的三大突破
文心5.0的发布标志着百度在大模型技术上的重大突破,其核心技术优势主要体现在三个方面。
原生全模态统一架构成为最大亮点。百度首席技术官王海峰阐释,与业界多数采用后期融合的多模态模型不同,文心5.0采用统一的自回归架构进行原生全模态建模。
这意味着从训练开始,模型便融合语言、图像、视频、音频等多模态数据,使得多模态特征在统一架构下充分融合并协同优化。
超稀疏混合专家架构的应用解决了模型规模与效率的平衡问题。文心5.0总参数规模高达2.4万亿,但激活参数比例却低于3%。
这种设计类似于一个庞大的“专家智库”,模型根据输入信息动态激活相关专家模块,在保持强大能力的同时显著提升推理效率。
智能体能力的飞跃同样令人瞩目。基于大规模工具环境,文心5.0合成长程任务轨迹数据,采用基于思维链和行动链的端到端多轮强化学习训练。
这种方法模拟了人类逐步思考和决策的过程,使模型能更好地理解任务目标并规划行动步骤。
02 性能表现:全球基准测试验证实力
在权威评测中,文心5.0展现出与世界顶尖模型抗衡的实力。
在LMArena大模型竞技场最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任务评测中位列全球并列第二、中国第一。尤其在创意写作、复杂问题理解等方面表现突出。
多模态能力方面,文心5.0在文档理解的部分基准测试中远超其他模型。它在OCRBench、DocVQA和ChartQA等测试文档识别、理解和结构化数据推理的基准中取得了领先成绩。
百度声称该模型在这些基于文档和图表的基准测试中击败了GPT-5-High和Gemini-2.5-Pro。
在音频理解方面,文心5.0的表现远超OpenAI GPT-4o和谷歌Gemini-2.5-Pro。其视觉生成能力则与Nana Banana、Veo 3等垂直领域专精模型相当。
03 实测体验:多模态能力全面剖析
机器之心等媒体对文心5.0 Preview版进行了实测,结果显示其在多种场景下均有出色表现。
视频理解方面,文心5.0能够准确识别电影片段,并根据内容生成恰如其分的弹幕。面对35分钟的七人英文对话视频,它可以准确罗列人物并总结每个人的核心观点。
图文生成能力同样令人惊艳。根据用户提供的“通体发光的白色小鹿”复杂描述,文心5.0生成的图片精准复现了所有细节,画面和谐自然。
更有趣的是,它还能以林黛玉的风格总结年度工作,准确把握了林黛玉的柔婉语调与敏感自省。
情感交互层面,文心5.0展现出高情商特质。当用户表达压力时,它不仅能给予安慰,还能提供急救方法、长期策略及思维调整建议,像一位温柔的心灵导师。
04 应用生态:从智能体到产业落地
百度同时发布了多项AI产品升级,构建了完整的应用生态。
自我演化智能体“百度伐谋” 引人注目,它可应用于交通、能源、金融、物流等领域。在海上风电平台设计中,伐谋既能快速产出高质量优化方案,又能适应动态调整的约束和目标。
数字人技术向全行业开放。慧播星数字人已落地巴西市场,与Kwai平台深度合作。本次双11,慧播星数字人GMV同比提升91%,开播直播间数同比增长119%。
无代码开发工具“秒哒” 升级至2.0版本,并首次推出海外版MeDo,荣登全球产品榜Product Hunt榜首。百度文库的全新能力也在海外推出了一站式AI学习办公平台Oreate,用户规模达120万。
05 硬件支撑:昆仑芯蓝图浮出水面
百度同时公布了其在AI芯片方面的路线图。
新一代昆仑芯包括两款产品:昆仑芯M100针对大规模推理场景优化设计,将于2026年上市;昆仑芯M300面向超大规模多模态模型的训练和推理需求,将于2027年上市。
同步发布的天池256超节点与天池512超节点将于明年正式上市,单个天池512超节点就能完成万亿参数模型训练。百度还预告了未来五年的计划,预计2030年将推出百万卡昆仑芯单集群。
目前,昆仑芯已累计完成数万卡部署,成为百度AI的关键底座。百度智能云通过昆仑芯和百舸AI计算平台,为大批企业提供了高性能、可扩展的AI算力。
文心5.0的发布标志着全球大模型竞赛进入新阶段。百度凭借原生全模态技术路线,在参数规模和应用生态构建上展现出与美国科技巨头不同的发展路径。
随着文心5.0 Preview版迅速上线文心App,普通用户已可亲身体验这场AI技术变革的力量。
从单模态、多模态到全模态,大模型的发展正从单一能力专精向全场景适配进化。百度此次的全栈布局,无疑为全球AI产业提供了新的发展思路。