2026-01-02
2026年才刚开年,字节跳动Seed团队就扔出一个大招GR-Dexter机器人系统。这回最炸的不是AI写代码,也不是机器人跳舞,而是它那双手。
21个自由度的灵巧手配上双臂,不仅能自己整理化妆台、用吸尘器打扫房间,还能抓起85%从未见过的东西,听懂你随口说的抽象指令,比如“拿个能喝的”或者“把颜色最深的那个递给我”。

是不是有点不敢信?别急,咱们慢慢看,这双手到底有多接近人类。
现在市面上很多机器人,看起来挺酷,其实手上功夫很糙。基本就是个电动夹子,开合一下,能夹个水瓶就算优秀了。
可生活哪有这么简单?整理化妆台要拉开抽屉、挑出口红、摆好眼影盘;用吸尘器得按开关、调档位、弯腰扫碎屑这些动作,没一双真正灵活的手,根本玩不转。
首先,控制太复杂。人类双手有27个自由度,机器人想接近这个水平,等于从按一个开关变成同时操控上百个关节,稍微协调不好就直接乱套。
其次,视觉容易被遮挡。手指又密又多,一干活就把摄像头挡住,连目标在哪都看不清。

最后,训练数据太稀缺。这种高自由度的操作,靠传统方式采集数据又贵又慢,行业卡在这儿好多年了。而字节这次,一口气把这三个难题全破了。
GR-Dexter的核心秘密,藏在它的ByteDexterV2灵巧手里。
这双手高219毫米、宽108毫米,大小跟成年人手掌差不多,却塞进了21个自由度。每根手指都能独立弯曲转动,尤其是拇指,特意多加了一个自由度,能轻松对握其他四指,抓东西又稳又准。
设计上也特别聪明。手指采用模块化结构,关节能单独控制,不会牵一发动全身。抓细小物件时,精准度拉满。

同时加入仿生运动逻辑,不用程序员逐帧调动作。比如抓杯子,手指会自动贴合杯身,既不打滑,也不捏碎。
最贴心的是,五个指尖都装了高密度触觉传感器,就像给机器人装上了皮肤。按按钮知道用多大劲,拿鸡蛋懂得轻一点,握工具立刻收紧。这份细腻,才是做精细活的关键。
再配上两条Franka机械臂,整套系统自由度飙到56个,外加四个不同角度的摄像头,彻底告别手挡住眼的尴尬。双臂配合起来,干活又快又稳,真有点左右互搏的意思了。
光有身体还不够,机器人得学本事。可谁来教它21自由度的手怎么动?普通人连操作界面都搞不明白。
字节的办法特别游戏化:让人戴上MetaQuestVR头显和Manus数据手套,像玩体感游戏一样远程操控机器人。你手腕一转,它就同步转;你手指一弯,它立刻模仿。脚边还配了个踏板,踩一下就能暂停,安全又顺手。

就这么玩着玩着,团队快速攒下了20小时化妆台整理和20小时抓取放置的高质量示范数据。
但这只是开始。他们还整合了三个开源机器人数据集,包含140小时操作视频和超过10万条动作轨迹,相当于让机器人跟着前辈偷师。
更狠的是,他们收集了800多小时人类第一视角的操作视频,洗碗、切菜、叠衣服、开瓶盖等全拿来当教材。
所有数据统一格式、对齐语义,相当于给机器人请了一堆名师,还帮它整理成一本万能操作手册。所以它学到的不是死套路,而是通用的生活智慧。
有了身体、有了经验,还得有个聪明的大脑。GR-Dexter的模型有40亿参数,像个超级管家,能把你说的话、它看到的画面、自己的状态全融合起来,生成一连串流畅动作。
最牛的是它的举一反三能力。教它抓马克杯,下次见到玻璃瓶、保温杯,它自己就知道怎么调整手势。听过把杯子放进盒子,换成把卷尺、胡萝卜、钥匙放进去,照样搞定。
登录/注册后继续阅读
立即登录/注册 >