英伟达开源王炸模型！35万动作一键调用，每秒15000帧，同行看麻了

2026-06-13

5分钟测出你真实AI能力、点击下方小程序

免费领取AI入门学习资料、全套题库

英伟达刚刚开源了一个王炸模型MotionBricks，直接把实时动作生成的桌子给掀了。

把35万段动作数据塞进一个模型里，推理延迟压到2毫秒，每秒狂飙15000帧。最爽的是，连虚幻引擎5和宇树G1机器人都能一套模型打通相当硬核。

说句不夸张的，动画和机器人赛道通过这个模型将会迎来很大的变革。

开源地址：https://github.com/NVlabs/GR00T-WholeBodyControl/tree/main/motionbricks

以前做角色动作是一个非常折磨人的活。传统做法靠动画师手搓状态机，几万段动画连来连去，工作量能把人逼疯。

后来大家指望AI生成，结果扩散模型跑起来慢得像老爷车，根本没法用在需要毫秒级响应的游戏和机器人上。

MotionBricks这次就是来终结这个死结的，做到了既能像传统方案那样实时响应，又能像大模型那样海量调用，真正实现35万动作一键调用。

海量动作+极速算力

MotionBricks能做到如此强悍的表现，核心在于自研的AI主干网络，这也是它承载海量动作、实现极速生成的关键。

整个网络提前完成训练，足足收录了35万多段人体动作片段，走路、跑跳、攀爬、格斗、拾取物品等各类动作一应俱全，单靠这一个模型，就能覆盖绝大多数使用场景。

针对人体这种连续动态数据，研发团队设计了全新的编码方式。以往技术会把整个人体动作当作整体拆分，一旦某个小单元出错，整套动作都会跟着变形。

而MotionBricks选择将人物躯干基点和四肢姿态分开处理，再用多组独立单元分别学习不同身体部位的运动规律。

其实这就像一支分工明确的团队，有人负责整体移动，有人负责手部动作，有人把控腿部姿态，就算某一部分出现小偏差，其他单元也能及时弥补，不会影响整体观感。

我觉得比较亮眼的是，这套编码方式上限极高，随着训练数据不断增加，模型效果还能持续优化，不会像老旧工具那样早早遇到性能瓶颈。

同时基于这套先进编码体系，主干网络又划分出3个分工明确的子模块。

第一个模块主打路线与时序规划，专门确定人物的行进方向和整套动作的时长。

就算用户发出瞬间转向、极速冲刺这类不合理指令，也会自动修正轨迹，杜绝瞬移、卡顿等怪异现象，保证交互全程流畅。

第二个模块是整个网络中体量最大的部分，主要根据既定路线生成完整的四肢与躯体姿态。

无论是简单的行走移动，还是攀爬、抓取这类精细互动，它都能根据参考姿态，输出精准自然的肢体动作。

最后一个模块负责整合所有数据，转化为我们最终看到的连续画面。它不仅能兼容后期的路线调整，有效避免脚滑、穿模等常见bug。

还会进一步打磨脚步落点、肢体摆动等细节，让动作更贴合真实人体的运动状态。

大家最关心的运行速度，更是这款框架的王牌亮点。整套网络动用32张高端显卡、耗时十余天才完成训练，但训练完成后，性能表现十分惊艳。

在主流高端游戏显卡上，动作生成延迟仅2毫秒，每秒可输出15000帧画面。

反观市面上其他AI动作模型，普遍存在十几毫秒甚至数秒的延迟，在实时性层面，MotionBricks实现了全方位领先，完全满足游戏、人形机器人对即时响应的严苛要求。

上手简单门槛低

除了强大的内核之外，MotionBricks还配备了2套简易控制模块，分别对应人物移动、物体互动两大高频场景。

而且全程无需二次训练、不用改动底层模型，真正做到即插即用，新手也能快速上手。

针对人物移动的模块，支持行走、潜行、奔跑、匍匐等20多种动作风格。它会先根据操作指令算出初步移动路线，再做平滑处理，防止动作忽快忽慢。

恭喜你顺利通过CAIE 注册人工智能工程师认证！你的 AI 专业能力已获官方认可。愿你继续在智能时代保持领先，持续进步、不断升级。