近期因春晚《武BOT》节目刷屏的宇树机器人,近日又抛出了一枚“技术深水炸弹”。3月初,宇树科技联合北京通用人工智能研究院、上海交通大学等机构,正式发布并开源了名为 OmniXtreme的人形机器人运动控制架构。与此同时,由宇树科技创始人王兴兴署名的相关技术论文也对外公开,系统性地展示了如何让机器人在后空翻、武术、霹雳舞等高动态场景下,实现人类级别的运动能力。
从“单项冠军”到“全能运动员”的跨越
让通用人形机器人拥有人类水平的运动能力,是机器人学领域的长期追求。然而,一个困扰行业多年的“通用性瓶颈”在于:当前的机器人更像一个“偏科生”,可以在某一单项上成为冠军,比如精准完成后空翻,却很难成为全能型的运动健将。当训练数据扩展至包含数十种风格迥异的复杂运动时,模型性能便会急剧衰退。
王兴兴曾在2025年世界机器人大会上坦言,目前的机器人运动控制存在强化学习的规模效应问题。每学习一个新技能,往往需要从头开始研究和教学,难以实现技能的持续积累与迁移学习。而OmniXtreme框架的诞生,正是为了破解这一高保真度与可扩展性难以兼得的难题。
双阶段训练:流匹配预训练与执行器感知后训练
OmniXtreme架构的核心创新在于其双阶段训练框架,将通用运动技能的学习与真实物理环境的技能精炼巧妙地分离开来。
第一阶段是可扩展的流匹配预训练。 研究团队首先针对每一个高难度动作,如后空翻、托马斯全旋、武术踢击等,训练一个“专家老师”策略。随后,基于数据集聚合的流匹配算法,将这些分散的专家知识融合进一个统一的“基座策略”中。相较于传统的MLP策略,流匹配作为一种高容量的生成式模型,能够天然地支持多模态动作分布,有效规避了传统强化学习在多任务联合训练时因梯度干扰而导致的“平均化”和性能崩溃问题。
第二阶段是执行器感知的残差后训练。 仿真环境中的高保真度并不等同于真实世界的物理可执行性。现实世界存在着复杂的物理约束:电机有扭矩极限、速度相关的力矩损失,以及再生功率带来的发热风险。为此,团队冻结了第一阶段学到的基座策略,在其上增加了一个轻量级的残差策略,专门负责在真实的电机力矩-速度包络线下进行精细化调整。通过激进的域随机化和功率安全正则化,让机器人学会在硬件极限下进行自我修正。
96.36%成功率背后的“功夫”
这一架构的突破性在真实硬件上得到了充分验证。实验数据显示,采用OmniXtreme框架的宇树G1人形机器人,在包含24种高动态运动的157次试验中,整体成功率高达91.08% 。其中,后空翻等极限动作的成功率达到了惊人的96.36% ,武术类动作成功率也为93.33%。
在具体的演示视频中,G1机器人不仅能够完成连续五个韦伯斯特空翻、长段霹雳舞表演,还能实现经手倒立姿势旋转后弹起等复杂的全身协调动作。这一切都建立在极高的控制效率之上,其端到端推理延迟被压缩至10毫秒,确保了机器人在高速运动中能够实时响应。
为了进一步验证其泛化能力,团队设计了渐进式压力测试。当训练动作集从10个扩展到50个时,传统强化学习基线模型的成功率从100%暴跌至73.9%,而OmniXtreme对核心动作的跟踪成功率依然坚挺在93.3% ,彻底推翻了“高保真度必定随着多样性增加而崩溃”的固有认知。
开源生态加速具身智能落地
目前,该研究的相关论文、模型检查点及代码已在GitHub及arXiv正式开源。研究团队透露,未来还将陆续公开流匹配基础策略训练与推理代码、C++真实部署代码等更多资源。
这意味着,全球的研究者和开发者都可以基于OmniXtreme框架,训练自己的人形机器人学会各种高动态运动技能,大大加速人形机器人运动控制领域的发展。有行业观点认为,2026年正是人形机器人从技术突破迈向规模化商业化的“破晓时刻” ,OmniXtreme的开源不仅展示了流匹配技术在具身智能领域的卓越扩展性,更为行业探索复杂物理环境下的稳健控制提供了关键技术范式。从春晚舞台的惊鸿一瞥到开源社区的“武功秘籍”公开,人形机器人的进化正在提速