2026-06-13
5分钟测出你真实AI能力、点击下方小程序
免费领取AI入门学习资料、全套题库

英伟达刚刚开源了一个王炸模型MotionBricks,直接把实时动作生成的桌子给掀了。
把35万段动作数据塞进一个模型里,推理延迟压到2毫秒,每秒狂飙15000帧。最爽的是,连虚幻引擎5和宇树G1机器人都能一套模型打通相当硬核。
说句不夸张的,动画和机器人赛道通过这个模型将会迎来很大的变革。

开源地址:https://github.com/NVlabs/GR00T-WholeBodyControl/tree/main/motionbricks
以前做角色动作是一个非常折磨人的活。传统做法靠动画师手搓状态机,几万段动画连来连去,工作量能把人逼疯。
后来大家指望AI生成,结果扩散模型跑起来慢得像老爷车,根本没法用在需要毫秒级响应的游戏和机器人上。
MotionBricks这次就是来终结这个死结的,做到了既能像传统方案那样实时响应,又能像大模型那样海量调用,真正实现35万动作一键调用。
海量动作+极速算力
MotionBricks能做到如此强悍的表现,核心在于自研的AI主干网络,这也是它承载海量动作、实现极速生成的关键。
整个网络提前完成训练,足足收录了35万多段人体动作片段,走路、跑跳、攀爬、格斗、拾取物品等各类动作一应俱全,单靠这一个模型,就能覆盖绝大多数使用场景。
针对人体这种连续动态数据,研发团队设计了全新的编码方式。以往技术会把整个人体动作当作整体拆分,一旦某个小单元出错,整套动作都会跟着变形。
而MotionBricks选择将人物躯干基点和四肢姿态分开处理,再用多组独立单元分别学习不同身体部位的运动规律。
其实这就像一支分工明确的团队,有人负责整体移动,有人负责手部动作,有人把控腿部姿态,就算某一部分出现小偏差,其他单元也能及时弥补,不会影响整体观感。
我觉得比较亮眼的是,这套编码方式上限极高,随着训练数据不断增加,模型效果还能持续优化,不会像老旧工具那样早早遇到性能瓶颈。
同时基于这套先进编码体系,主干网络又划分出3个分工明确的子模块。

第一个模块主打路线与时序规划,专门确定人物的行进方向和整套动作的时长。
就算用户发出瞬间转向、极速冲刺这类不合理指令,也会自动修正轨迹,杜绝瞬移、卡顿等怪异现象,保证交互全程流畅。
第二个模块是整个网络中体量最大的部分,主要根据既定路线生成完整的四肢与躯体姿态。
无论是简单的行走移动,还是攀爬、抓取这类精细互动,它都能根据参考姿态,输出精准自然的肢体动作。
最后一个模块负责整合所有数据,转化为我们最终看到的连续画面。它不仅能兼容后期的路线调整,有效避免脚滑、穿模等常见bug。
还会进一步打磨脚步落点、肢体摆动等细节,让动作更贴合真实人体的运动状态。
大家最关心的运行速度,更是这款框架的王牌亮点。整套网络动用32张高端显卡、耗时十余天才完成训练,但训练完成后,性能表现十分惊艳。
在主流高端游戏显卡上,动作生成延迟仅2毫秒,每秒可输出15000帧画面。
反观市面上其他AI动作模型,普遍存在十几毫秒甚至数秒的延迟,在实时性层面,MotionBricks实现了全方位领先,完全满足游戏、人形机器人对即时响应的严苛要求。
上手简单门槛低
除了强大的内核之外,MotionBricks还配备了2套简易控制模块,分别对应人物移动、物体互动两大高频场景。
而且全程无需二次训练、不用改动底层模型,真正做到即插即用,新手也能快速上手。
针对人物移动的模块,支持行走、潜行、奔跑、匍匐等20多种动作风格。它会先根据操作指令算出初步移动路线,再做平滑处理,防止动作忽快忽慢。
登录/注册后继续阅读
立即登录/注册 >