1月15日,国际评测榜单上,文心大模型ERNIE-5.0-0110以数学能力全球第二、综合文本能力全球第八的成绩,成为前十名中唯一的中国代表。
2026年1月15日,全球权威大模型评测平台LMArena公布最新排名,百度文心大模型ERNIE-5.0-0110以1460分的成绩位列文本能力榜全球第八、国内第一,是该榜单TOP10中唯一的中国大模型。
同时,在数学能力专项排名中,ERNIE-5.0-0110更是夺得全球第二的优异成绩,仅次于GPT-5.2-High。标志着中国大模型在复杂推理与数理分析领域已达到国际顶尖水平。
01 评测突破
在全球AI模型竞技场的最新评估中,ERNIE-5.0-0110展现了中国大模型的强劲实力。它在文本能力综合评测中超越了GPT-5.1-High、Gemini-2.5-Pro等国际主流模型。
数学推理能力尤为突出,在全球范围内仅次于GPT-5.2-High,位列第二。这一成绩证明了国产大模型在复杂逻辑推理方面的显著进步。
值得注意的是,进入LMArena榜单的文心大模型5.0版本不再标注“Preview”,表明该模型已完成预览阶段,成为正式版本。
02 能力解析
ERNIE-5.0-0110在多个维度表现出色。除了顶尖的数学处理能力,它还具备强大的专家知识与编程能力。
在创意写作与复杂指令执行方面,该模型同样表现优异,成功超越Claude-Opus-4-1、GPT-5.2、Qwen3-Max-Preview等多款国内外主流模型。
此外,该模型在科学、商业金融、医疗健康等多领域职业分类中均跻身前十,展现出广泛的专业应用潜力。
03 技术支撑
ERNIE-5.0-0110的技术突破源于其先进的原生全模态架构。作为百度2025年11月发布的新一代大模型,它采用原生全模态统一建模技术。
这一模型参数规模高达2.4万亿,从训练初期就打造了支持文本、图像、音频、视频等数据输入与输出的全模态理解与生成能力。
通过百度“芯片-框架-模型-应用”全栈AI技术的不断优化,文心大模型在多模态理解、指令遵循、工具应用等方面的功能得到全面巩固。
04 多模态领先
在LMArena视觉理解榜单中,文心大模型同样位居国内榜首,超过多款国内外主流模型。
作为原生全模态大模型,文心5.0具备全面的多模态理解与生成能力,可支持文本、图像、音频、视频等多种类型信息的输入与输出,实现跨模态深度融合与应用。
与许多模型“先处理单模态、再拼接融合”不同,文心5.0从训练一开始就把文字、图片、视频、音频等数据统一处理,真正实现了多模态信息的一体化理解与生成。
05 行业影响
文心大模型5.0的突破标志着国产大模型正从“可用”向“好用”阶段迈进。
百度已同步将这一模型上线文心App、文心一言网页版及百度千帆大模型平台,开发者和企业用户可直接调用其API服务。
在2025年11月的百度世界大会上,公司强调“智能本身是最大的应用,技术迭代速度是唯一的护城河”,而文心5.0正是这一理念的最新实践。
06 国际竞争
全球AI模型竞争日趋激烈,评测榜单成为技术实力的重要标尺。在此背景下,文心大模型的突破具有特殊意义。
此前发布的文心大模型5.0 Preview版本已在LMArena文本榜单中达到全球并列第二、国内第一的成绩。
此次正式版本的发布和评测成绩的公布,进一步证明了中国在大模型领域已具备与国际顶尖玩家同台竞技的技术实力。
当全球AI竞争焦点逐渐从参数规模转向理解力深度,百度文心大模型在LMArena榜单上的突破性表现,向世界展示了中国在人工智能核心领域的技术实力与创新速度。
此次ERNIE-5.0-0110以数学能力全球第二、综合能力全球第八的成绩亮相国际舞台,不仅是一次技术里程碑,更是国产大模型从追赶到并跑的重要标志。