错误率暴降97%!Claude突发Managed Agents,乐天直接砍掉自研检索基建

2026-04-24

关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
CAIE注册人工智能工程师
CAIE注册人工智能工程师
公众号作者
CAIE,全称 Certifed Artifcial Intelligence Engineer(人工智能工程师),简称 CAIE(赛一) ,是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

今天早上5点,Claude宣布Managed Agents(托管智能体)全面开启公测。

之前咱们用智能体最头疼的就是跨会话啥都记不住,每次对话都像重新认识一样。

现在通过Managed Agents可以解决难题了,并且整个记忆体系的设计特别贴合开发者的实际使用习惯

大厂企业已经投入使用,效果非常炸裂

现在已经有不少大厂把这个记忆功能落地到实际业务里了,反馈都特别好。

不光闭环了业务里的反馈流程、加快了各类校验的速度,甚至直接替代了企业自己搭建的自定义检索基础设施,省去了大量的开发和维护成本。

Netflix用这个功能让智能体跨会话保留上下文,不管是多轮对话聊出来的业务洞察,还是人工中途修正的内容,智能体都能记下来。

不用工程师手动去更新提示词和技能,大大减少了重复的人工操作。

乐天更夸张,基于任务的长时智能体靠记忆从每次会话里学经验,直接避免了重复犯错,首次执行的错误率直接降了97%

 而且整个学习过程都在工作空间里,能观测、能管控,不用担心里程碑式的失控。

Wisedocs基于这个托管智能体搭了文档校验的流程,智能体靠跨会话记忆识别并记住那些高频出现的文档问题。

连一些之前工程师没考虑到的问题都能精准捕捉,文档校验的效率直接提升了30%

Ando则是在这个基础上做了企业通讯平台,智能体能自动记录不同组织的交互模式,不用团队自己从头开发记忆基础设施,能把所有精力都放在产品本身的打磨上。

智能体终于能持续进化了

其实Claude托管智能体本身就搭好了生产级的基础设施和调优过的运行框架,这次加的记忆功能算是把这个基础的能力又往上提了一大截。

官方针对长时间运行的智能体做了专门的基准优化,简单说就是智能体不再是总忘记单次会话,能从每一次对话里攒经验。

不同会话之间还能共享这些学到的东西,用得越久越贴合实际使用需求。

此外,底层搭建逻辑,不是另起炉灶搞新东西,而是直接基于智能体本来就会用的工具。

记忆模块直接挂载在文件系统上,Claude原本就很能打的bash命令和代码执行能力都能直接用上,不用开发者重新适配学习。

这种基于文件系统的记忆方式,让新模型能存的内容更全、整理得更有条理,还能自己判断哪些信息是做特定任务必须记住的,不用人工去筛选标注,省了大把时间和精力。

记忆管理全在自己手里

这个记忆功能从一开始就是冲着企业级生产部署去的,不是给个人玩家做的简易版。

精细化的权限控制、完整的审计日志、全流程的程序化管控全都配齐了,完全能满足企业的合规和管理需求。

确定要退出登录吗?
确定 取消