2026年3月20日,全球知名的大模型盲测榜单LMArena更新了最新一期排名。阿里巴巴千问团队最新旗舰模型Qwen3.5-Max-Preview(预览版) 首度亮相,以1464分的综合得分强势闯入全球第一梯队,带动阿里千问在全球大模型公司排行榜中跃升至第五位,问鼎中国第一。
超越海外巨头,多项能力跻身全球前列
LMArena竞技场是由国际开源机构LMSYS组织的第三方大模型测评榜单,被誉为AI领域最公正、最权威的全球大模型性能榜单之一。该榜单采用盲测机制,由全球开发者在不知晓具体模型的情况下展开两两PK,根据投票结果形成最终排名。
在最新一期榜单中,Qwen3.5-Max-Preview表现惊艳,一举超越了GPT-5.4、Claude 4.5 Sonnet、Grok 4.1等海外顶级模型,同时也超过了豆包2.0、GLM5、Kimi2.5等全部国产模型。
细分能力方面,这款旗舰预览版同样交出了亮眼成绩单:
- 数学能力:位列全球第五、中国第一,展现出强大的逻辑推理能力
- 专家级文本能力:跻身全球前十、中国第一,在处理复杂文本任务时表现优异
- 综合性能(无风格控制):以1470分排名全球第六,在去除风格控制变量的严格测试中验证了模型的基础实力
与前代相比全面跃升,正式版值得期待
与前代Qwen3-Max相比,Qwen3.5-Max-Preview在多个高频应用场景中实现了显著提升:
- 创意写作:提升57分
- 数学能力:提升49分
- 娱乐、体育与媒体类任务:提升48分
- 整体文本能力:提升45分
这一系列数据表明,新版本在保持能力均衡发展的同时,在关键领域实现了质的突破。
技术底蕴深厚,开源生态完善
千问3.5是阿里于今年除夕发布的最新一代大模型系列,目前已开源0.8B到397B的8款不同尺寸模型,形成了完整的开源梯度,广受全球AI开发者和企业欢迎。
其中,Qwen3.5-Plus采用约3970亿总参数、170亿激活参数的创新架构,以“小”胜“大”,性能超过两倍乃至三倍其参数量的知名模型。此次亮相的Qwen3.5-Max-Preview是该系列旗舰模型的预览版,也是阿里当前参数规模最大的闭源旗舰模型。
中国力量崛起,五家中国企业闯进全球前十
值得一提的是,在LMArena基于各公司最强模型对全球大模型机构进行的排名中,中美两国各占据了全球前十的半壁江山。五家中国公司成功闯入前十,分别是:
- 阿里巴巴:全球第五、中国第一
- 字节跳动、智谱、月之暗面、百度:同样跻身全球前十
结语:预览版打响头炮,正式版蓄势待发
Qwen3.5-Max-Preview的惊艳亮相,标志着国产大模型在国际竞争中再次实现技术突破。目前这一版本仍处于预览阶段,有消息称,Qwen3.5-Max正式版或将于近期发布,能力还将继续进化升级。
随着正式版本的到来,这款旗舰模型在复杂场景下的稳定性、多模态处理能力等关键指标,将成为决定其能否持续领跑国际竞争的重要因素。阿里千问的这场“开门红”,无疑为国产大模型的商业化应用开辟了新的想象空间