2026-01-29
今天早上5点,谷歌展示了一项重要研究,验证了AI圈经常提的一个重要的多AI智能体法则,是错的。
谷歌经过对180种智能体配置的测试中发现,在可并行处理的任务中性能提升81%,但在顺序型任务中性能下降70%。
所以,智能体架构与任务的匹配度,比智能体的数量更重要。

论文地址:https://arxiv.org/pdf/2512.08296
下面咱就仔细唠唠谷歌到底是怎么得出这个结论的。
先搞懂,什么任务才需要智能体
想弄明白智能体怎么规模化才合理,首先得分清哪些任务适合用智能体来做。
传统的测试方法,只能看出模型懂多少知识,就像考死记硬背的知识点,根本反映不出实际用的时候会遇到的复杂情况。
谷歌梳理出了三个关键特征,满足这些的任务,才算真正适合智能体。
第一,得能和外部环境持续互动,还得是多步骤的那种,不是一次性就结束。
第二,就算有些信息看不到,也能主动反复去收集补充。
第三,能根据环境给的反馈,灵活调整自己的策略。
谷歌选了五种最典型的智能体架构来测试,一种是单个智能体干活,另外四种是多个智能体配合的不同模式,还找了四个不同类型的测试场景,有金融推理、网页导航、任务规划,还有工具使用。

单个智能体就很简单,自己从头做到尾,所有思考和行动都按顺序来,记忆也是连贯的。
多个智能体的模式里,独立式就是大家各做各的子任务,互不沟通,最后凑一起汇总结果。集中式有个核心协调者,像个项目经理,分配任务还整合大家的输出。
去中心化式就是大家平级沟通,有啥信息直接分享,一起商量出结果。混合式就是两者结合,既有上级统筹,又允许大家灵活沟通,平衡好管控和效率。
这五种架构各有特点,独立式并行效率最高,沟通成本也最低。去中心化式靠大家一轮轮讨论推进,混合式则兼顾了统筹和灵活。
不同架构的计算难度、沟通开销都不一样,选的时候得结合任务来看。
三种黄金搭配方法,避免踩坑
第一个是匹配很重要,就像找搭档得性格合拍。像金融推理这种能并行的任务,用集中式架构效果最好,比单个智能体效率提升了八成多。
把复杂任务拆开来分给不同智能体,各自发挥优势,整体效率自然就上去了。
第二个是串行任务别硬堆智能体,会有惩罚效应。像规划类任务,必须一步接一步推导,多个智能体之间沟通来沟通去,反而会打乱思路,占用大量精力,留给核心任务的思考资源就不够了。
谷歌测试的所有多智能体模式,在这类任务上性能都下降了三成九到七成,跌幅特别明显。

第三个是工具使用有瓶颈,这里面有个权衡的问题。任务需要用到的工具越多,多智能体之间协调的成本就越高,而且不是线性增长,是突然飙升的。
登录/注册后继续阅读
立即登录/注册 >