一段简单的文字指令输入后,屏幕上原本僵立的游戏角色突然“活”了过来——它开始奔跑、跳跃,甚至执行“一边踢足球一边挥动手臂”的复杂组合动作,所有这一切不再需要专业的动画师逐帧制作。
腾讯混元团队于2025年12月31日开源了10亿参数的HY-Motion 1.0模型,这是业界首个将DiT(扩散变换器)架构在动作生成领域扩展至十亿参数量级的系统。
这款模型能将自然语言指令直接转化为高质量、多样化的3D人体动画,覆盖超过200种运动类别。
01 技术飞跃:从静态到动态的AI革命
腾讯HY-Motion 1.0的核心创新在于解决了传统3D动画制作的效率瓶颈。传统流程中,绑定蒙皮环节通常需要1至3.5天每件,骨骼动画制作则需3至7天完成10秒动画。
而HY-Motion 1.0通过智能分析模型结构,能够高效生成适配的骨骼系统,不仅支持人形角色,还涵盖四足生物、鸟类和怪物等任意角色的骨骼生成。
这款模型基于扩散变换器架构和流匹配技术,是业界首个具备完整预训练→SFT→RL循环的动作生成模型。
它能通过“先规模后精细”的三阶段训练策略,有效平衡动作的泛化能力与生成质量,解决传统模型常见的指令理解弱、动作滑步抖动等问题。
02 数据驱动:200+动作类别的背后工程
HY-Motion 1.0能够覆盖200多个运动类别,这得益于团队构建的完整数据管线。研究团队汇集了1200万个野外视频片段、动作捕捉数据以及专业制作的3D动画资产。
所有动作数据被统一重定向到标准的SMPL-H骨架上,通过严格的过滤机制剔除了重复、异常姿态及存在严重滑步伪影的片段。
为了确保训练数据的语义准确性,团队采用Gemini-2.5-Pro等视觉语言模型生成初步的动作描述和关键词,并通过人工校验修正错误,最终利用大语言模型对文本结构进行标准化。
这种精细的数据工程,使HY-Motion 1.0不仅能生成基础动作,更能精准执行复杂的组合指令,为高交互性、高物理精度的下一代动作生成技术打下了基础。
03 改变游戏规则:从“天级”到“秒级”的创作效率
在游戏开发领域,HY-Motion 1.0带来的效率提升是颠覆性的。该技术已应用于《和平精英》《王者荣耀》《PUBG Mobile》等近100个游戏项目,使生产效率提升了8倍以上。
传统3D制作需要经历“3D建模→绘制贴图→绑定骨骼→设计动作”等繁琐步骤,而借助混元3D模型,开发者可以直接通过原画或文本描述生成动画。
更重要的是,HY-Motion 1.0生成的动画质量已接近甚至超越行业顶尖水平。新发布的MotionGen Beta模型使滑步、抖动、扭曲等异常现象的出现概率降低了6倍。
04 开源生态:推动行业创新的关键一步
腾讯选择将这一突破性技术开源,体现了其在AI生态建设上的战略布局。HY-Motion 1.0的完整代码、预训练模型和详细文档均已开放,便于学术研究和工业部署。
这并非腾讯首次在3D生成领域开源重要模型。早在2025年7月,腾讯就开源了混元3D世界模型1.0,随后又开源了混元3D-Omni和混元3D-Part两大模型。
腾讯混元3D系列模型已成为全球最受欢迎的3D开源模型之一,社区下载量超过260万次。这种开放策略降低了行业技术门槛,为VR/AR、游戏、教育等下游应用提供了强大的技术支撑。
开源消息发布后,立即引发了行业内的热烈讨论。有游戏行业人士表示,这样的模型开源“在游戏行业确实非常有用”,将“解锁许多富有创意的应用场景”。
05 未来展望:从动作生成到智能交互的演进
尽管HY-Motion 1.0已展现出强大的能力,但技术团队承认,在处理极度复杂的长指令和涉及精细物体交互的场景时仍有提升空间。
当前的训练数据主要关注人体本身的运动学特征,对于手持物体的大小、重量及接触点的物理反馈尚缺乏显式建模。
腾讯游戏VISVISE团队在SIGGRAPH Asia上展示的AI全流程3D角色动画制作管线,已经包含了骨骼生成、智能蒙皮、3D动画生成、智能插帧四大模块,构建了从静态模型到动态动画的完整闭环。
随着AI技术的持续演进,未来游戏中的NPC不仅能够执行预设动作,更能根据环境变化和玩家交互实时生成合理的反应与动作,真正实现“智能生命体”的体验。
游戏开发者已经能够通过VISVISE系统,在数秒内生成10秒的高质量动画,而以往这需要3到7天的手工制作。在《和平精英》等游戏中,AI生成的动画已经悄然融入玩家的每一次奔跑、跳跃和射击中。
随着HY-Motion 1.0等技术的开源,一个曾经需要专业团队数周完成的工作,现在可能只需要一段文字指令和几秒钟的等待。游戏开发者们正在重新分配时间与精力——从繁琐的重复劳动转向真正的创意表达。