腾讯开源王炸模型，拿下16项主流测试第一！AI真正走进物理世界了

2026-04-13

关注CAIE，国内头部AI人才认证、培训体系，助你在职场升职加薪。

CAIE注册人工智能工程师

公众号作者

CAIE，全称 Certifed Artifcial Intelligence Engineer（人工智能工程师），简称 CAIE（赛一），是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

最近腾讯混元视觉团队联合RoboticsX实验室，开源了一个专门给现实世界具身智能体用的王炸模型HY-Embodied-0.5。

这个模型在22项国际权威测试里拿下16项第一，大参数32B版本媲美谷歌的Gemini 3.0 Pro模型。具身智能的“iPhone时刻”，这次可能真的要被腾讯给催熟了。

开源地址：https://huggingface.co/tencent/HY-Embodied-0.5

可能很多人对具身智能这个词有点陌生，简单说就是让AI不只是停留在屏幕里聊天、做题、生成内容，而是能看懂真实环境、会思考操作步骤，还能指挥机器臂完成精准动作。

过去这一步一直很难迈过去，主流的视觉语言模型要么看不清物理空间里的深度、位置和细节，或者只会处理静态图片，完全不懂怎么规划动作、怎么和现实物体交互。

而HY-Embodied-0.5要解决的，就是这个横在数字智能和物理世界之间的最大鸿沟。

两个版本，落地场景广泛

腾讯这次没有只做一款大而全的模型，而是直接推出两个版本，覆盖了从终端部署到云端推理的全部场景，这种设计非常贴合实际使用需求。

其中小型号是HY-Embodied-0.5-MoT-2B，激活参数20亿，总参数40亿，主打一个轻巧高效，专门用在边缘设备上，保证实时响应的同时还能保持强悍性能。

大型号则是HY-Embodied-0.5-MoE-A32B，激活参数320亿，总参数高达4070亿，专攻复杂场景下的视觉感知和深度推理，能力直接拉满。

两款模型从架构、数据到训练方式都做了全套优化，不是简单的参数缩放，而是每一处设计都围绕物理世界的感知和操作展开，最终实现了小模型好用、大模型超强的效果。

架构三大升级

想要让AI适配现实世界，模型架构必须重新打磨。HY-Embodied-0.5在经典视觉语言模型的基础上，做了三项关键改进，每一项都精准解决了实际问题。

首先是升级了HY-ViT2.0视觉编码器。传统的视觉模型需要把图片裁剪成固定尺寸，很容易丢掉关键的空间信息，而且大模型很难在终端跑起来。

新版编码器原生支持任意分辨率输入，不用裁剪缩放就能完整保留画面信息，参数只有4亿，经过大模型蒸馏之后，轻巧又精准，还能同时完成理解和重建，保证送给语言模型的视觉信息没有损耗。

其次是用上了混合Transformer架构，也就是MoT。过去多模态训练经常出现一个问题，视觉任务练多了，语言能力就会下降，小模型尤其明显。

MoT架构把视觉和语言的计算路径分开，视觉信息用独立参数处理，文本信息保留原有参数，再给视觉部分配上专属的双向注意力和监督任务，既强化了视觉能力，又不会拖累语言表现。

实际测试下来，这种架构收敛更快，损失更低，推理的时候几乎不增加额外开销，非常适合小模型使用。

最后是加入了视觉潜在token，相当于给视觉和语言之间搭了一座专用桥梁。它能把画面里的关键物体、空间位置，和语言里的操作指令、语义信息精准对应起来。

从注意力可视化的结果能看到，模型能精准定位到薯片罐端口、抽屉把手这类细小部位，同时关联上关闭、抓取这类动作指令，跨模态理解的能力直接上了一个台阶。

模型再优秀，也离不开高质量的数据支撑。腾讯这次构建了超过一亿样本的多模态数据，总token量突破千亿级别。

并分成四大板块，从基础视觉感知到复杂空间理解，再到机器人操作规划，全覆盖无死角。

测试数据

为了测试HY-Embodied-0.5性能，研发团队用二十二项国际权威基准测试，从视觉感知、具身理解到空间理解三个维度，全面验证模型性能。

小型号MoT-2B在二十二项测试里拿下十六项第一，四项第二，平均分达到58%，比参数更大的同类型模型高出近十个百分点，在通用视觉任务上也和主流模型旗鼓相当。

大型号MoE-A32B平均分67%，直接超越了谷歌Gemini 3.0 Pro，以及多款全球一线视觉语言模型，直接跻身全球第一梯队。

除了纸面数据，模型还在真实机器人上完成了验证。基于小模型底座打造的视觉语言动作模型，在双臂机器人上完成精密插件组装、餐具堆叠、杯子悬挂三项高难度任务。

其中难度最高的杯子悬挂任务，成功率达到75%，远超对比模型，充分证明模型的能力可以真正落地到物理操作中。

想系统掌握AI核心技能、获取行业认可资质？

CAIE注册人工智能工程师认证

助你拓宽职业赛道，成为AI领域持证实力派

微信小程序

CAIE 认证

CAIE认证

以上内容来自微信小程序

企业、高校及渠道合作

请联系微信：FYLlaoshi

完谢谢观看

恭喜你顺利通过CAIE 注册人工智能工程师认证！你的 AI 专业能力已获官方认可。愿你继续在智能时代保持领先，持续进步、不断升级。