谷歌官方ADK王炸!让AI智能体自己造Skills,token成本暴降90%

2026-04-02

关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
CAIE注册人工智能工程师
CAIE注册人工智能工程师
公众号作者
CAIE,全称 Certifed Artifcial Intelligence Engineer(人工智能工程师),简称 CAIE(赛一) ,是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

AI智能体开发的朋友肯定都踩过这个坑,想让Agent多会点本事,就一个劲往系统提示词里塞规则、贴指南、加API说明。

最后提示词臃肿到不行,每次调用大模型都耗一堆tokens,关键大部分内容用户根本用不上,纯纯资源浪费。

而谷歌最新推出的ADK也就是Agent开发工具包的Skill Toolset核心组件,直接把这个痛点给解决了,并且token成本直接暴降90%

原文:https://developers.googleblog.com/developers-guide-to-building-adk-agents-with-skills/

谷歌ADK能实现这个突破,核心靠的是渐进式信息披露的架构思路,就是不让Agent把所有知识死记硬背,而是给它弄个“Skills菜单,需要哪个技能再去翻详细说明。

甚至查配套资料,不用再把几千个tokens的内容全堆在一个提示词里,既省了token资源,Agent的反应速度也快了不少。

ADK把知识加载分成了三个层级,就像我们平时看书,先看目录找方向,再翻章节看细节,最后查参考文献补内容,一步一步来,不浪费一点token和精力。

第一层是L1元数据,每个技能只占大概100tokens,就包含技能名字和简单描述,Agent启动的时候全加载好,相当于一个技能菜单。

Agent接到任务先看菜单,找对应的技能就行,不用再翻所有内容,这点token成本几乎可以忽略。

第二层是L2指令,每个技能最多5000tokens,是这个技能的完整操作步骤,只有Agent确定要用到这个技能了,才会通过API加载,不用的时候根本不占任何token资源。

第三层是L3资源,就是样式指南、API规范这类外部参考文件,只有技能的具体步骤里明确需要这些资料了,才会按需加载,真正做到精准调用,不做无用功,不花冤枉token

这么算下来就很直观了,一个有10个技能的Agent,以前启动一次要耗10000tokens,现在只要1000个就够了,直接省了90%的基线上下文token资源。

这效率提升可不是一点半点,token成本也跟着大幅下降,对于高频调用大模型的开发者来说,这波省下来的成本真的太香了。

ADK里的SkillToolset类就是实现这个架构的核心,它会自动生成三个工具,刚好对应这三个层级:list_skillsL1的技能列表,load_skill加载L2的具体指令,load_skill_resource调取L3的参考资料。

不用我们自己再写额外的代码,特别省心,开发效率直接翻倍,还能精准控费。下面是几个ADK常见的自动创建Skills方法。

嵌入式Skills

这是ADK里最简单的Skill实现方式,就像我们在代码里贴个便签,把技能的名字、描述和具体指令直接写成Python对象,嵌在Agent的代码里就行,不用搞复杂的目录结构,特别适合那些内容固定、几乎不用改的小规则。

比如简单的SEO检查、格式校验、基础数据核对这类场景,新手一分钟就能上手,还不额外耗token

例如,做一个博客SEO优化的技能,直接定义一个seo_skill对象,写清楚名字是seo-checklist,描述是给博客做SEO检查,涵盖标题、元描述、标题层级这些核心内容。

再把具体的检查步骤一条条写在指令里,比如标题要控制在50-60个字符,核心关键词尽量前置,元描述要加行动号召语句这些细节。

这个对象里的名称和描述会自动变成L1元数据,每次调用大模型都能读到,而具体的检查步骤就是L2指令。

只有用户让Agent审核博客SEO的时候,Agent才会加载这些步骤,按条系统执行检查,简单又实用,不用把所有SEO规则都塞在提示词里浪费token

这种方式的好处就是上手快,代码写好直接用,不用管其他配置,新手也能轻松掌握。

但缺点也很明显,如果技能需要参考其他资料,或者想在多个Agent里复用,就不太方便了,这时候就可以升级到下一个模式,实用性会更强,也能进一步优化token使用效率。

基于文件的Skills

嵌入式Skills适合简单的小技能,但如果你的技能需要搭配参考文档,比如写博客需要对应的样式指南,调用API需要详细的规范说明,做数据校验需要参考标准表,这时候嵌入式就不够用了。

得用基于文件的Skills,把技能做成一个独立的参考手册,弄个专属目录,把指令和参考资料分开放,条理更清晰,复用性也更强,还能避免把参考资料的内容塞到提示词里浪费token

这个专属目录里,必须有一个SKILL.md文件,这是技能的核心,开头写技能的基本信息,后面用Markdown写具体指令,这就是对应的L2内容。

还可以建一个references子目录,把样式指南、API规范、标准数据表这些参考资料全放进去,这就是L3资源,需要的时候再按需加载,不占额外token资源。

比如做一个博客写作的技能,就建一个blog-writer目录,里面放SKILL.md,把写作的步骤、要求、注意事项全写清楚,references里放style-guide.md样式指南,代码里只需要调用load_skill_from_dir方法,指定这个目录的路径,就能一键加载整个技能,特别方便。

这种方式把技能和参考资料拆分开,让知识变得可复用,只要是遵循agentskills.io规范的Agent,都能加载这个目录。

不用再重复写代码,大大节省开发时间,更重要的是,参考资料不用提前塞到提示词里,只有需要的时候才加载,能有效减少token消耗。

不过美中不足的是,这个SKILL.md文件还是需要我们自己手动写,要是能直接用别人写好的,效率会更高,这就是第三种模式的核心价值。

外部Skills

其实外部Skills和基于文件的Skills原理完全一样,核心区别就在于技能目录的来源不一样,不用我们自己从头写SKILL.md,直接从社区的资源库比如awesome-claude-skills里下载别人写好的技能目录。

然后用和模式二一样的load_skill_from_dir方法加载就行,代码都不用改,真正的抄作业式开发,新手也能快速搭建高能力的Agent,还能省掉自己写技能的时间和试错的token成本。

谷歌自己也会用这个规范发布官方的ADK开发技能,直接用npx命令就能一键安装,特别方便。因为agentskills.io规范定义了统一的目录格式,所以不管是自己写的还是从外部下载的,Agent都能精准识别加载,完全不挑来源,兼容性拉满。

其实这三种模式下来,我们就能轻松把现成的、自己写的、社区分享的技能都用起来,Agent的能力库能快速扩充,开发效率也能大幅提升,还能通过按需加载精准控制token消耗。但说到底这些技能还是人写的。

而谷歌ADK的终极玩法,是让Agent自己写技能,也就是第四种模式,这才是真正的王炸功能,不仅能省开发时间,还能让Agent根据需求灵活造技能,进一步优化token使用。

Skills工厂

这是ADK最有意思、也最核心的一个模式,核心是做一个元Skills,就能自己创造Skills

Agent装上这个元Skill,它就有了自扩展能力,不用我们手动写代码,它能自己在运行时生成新的Skill,然后加载使用,真正实现了AI智能体的自我进化,从此再也不用为了新增技能反复修改提示词、浪费token了。

这个元Skill其实也是一个嵌入式Skill,核心关键就在resources字段,我们把agentskills.io的规范文档和一个完整的技能示例,作为L3资源嵌在这个字段里,然后在指令里写清楚,让Agent严格按照这个规范和示例,生成符合要求的SKILL.md文件。

比如做一个skill-creator的元Skill,先写清楚它的作用是根据需求生成兼容ADK的全新技能,然后在指令里定好明确的规则:技能名称要用短横线命名,字符数不超过64

描述字符数不超过1024,指令要清晰明确分步骤写,SKILL.md文件行数控制在500行以内,详细内容放到references目录里等等。

Agent接到创建新技能的请求时,会先自动加载这个元Skill,然后通过load_skill_resource调取里面的规范和示例,照着样子生成完整的SKILL.md文件。

比如你让它造一个Python代码安全审查的技能,它会自动生成符合规范的技能名称、覆盖输入验证、身份认证、加密技术的结构化审查步骤,还有基于风险等级的报告格式,全程不用人插手,生成的技能直接就能用,而且按需加载,不会浪费一点token

而且更牛的是,生成的这些技能,都遵循统一的agentskills.io规范,因此不仅能在ADK里运行,还能兼容Gemini命令行工具、ClaudeCodeCursor等主流产品,通用性拉满,一次生成,多平台可用,相当于一次造技能多处省token

这里也给大家提个醒,虽然AI自己造技能特别方便,能省大量开发时间和token成本。

但还是建议保留一个人工审核的步骤,把生成的SKILL.md文件当代码一样仔细看一遍,再用ADK做个效果测试,确保技能能按预期工作,再部署使用,避免出现不必要的问题,反而浪费token

整合所有模式,创建自己的skills工厂

学会了这四种模式,接下来就是把它们整合起来,几步代码就能搭出一个完整的Skill工厂,让Agent既有现成的技能可用,又能自己造新技能,真正实现能力的自主扩展,还能把token成本牢牢控制在手里,实现效率和成本的双重优化。

首先用SkillToolset把前面做的嵌入式技能、基于文件的技能、外部技能和元Skill全打包进去,然后创建一个Agent,指定用的大模型,比如gemini-2.5-flash,给Agent起个名字,写清楚它的定位。

比如博客写作助手、代码审查助手,再在指令里告诉Agent,要按需加载相关技能,用load_skill_resource访问参考资料,执行任务的时候要说明用的哪个技能及原因。

这样一个完整的、能自己造技能的Agent就做好了。比如你给它装了SEO检查、博客写作、内容研究三个基础技能。

再加一个skill-creatorSkill,平时写博客,它会自动加载SEO检查和博客写作技能,按步骤完成创作和优化,不用把所有技能指令都塞在提示词里浪费token

如果你让它造一个用于撰写技术博客引言的Skill,它会立刻调用元Skill,生成对应的SKILL.md文件,你把这个文件存到指定目录,下次就能直接用load_skill_from_dir加载使用。

相当于Agent自己给自己升级了,完全不用开发者手动介入修改提示词,从根源上减少token的消耗。

而这一切的背后,都是Skill Toolset在自动工作,它生成的三个工具会对应渐进式信息披露的三个层级,自动完成技能列表展示、指令加载、资料调取。

我们只需要专注于技能本身的设计,不用管底层的调用逻辑,开发难度大幅降低,效率却大幅提升,这才是AI开发的最优解。

想系统掌握AI核心技能、获取行业认可资质?

CAIE注册人工智能工程师认证

助你拓宽职业赛道,成为AI领域持证实力派

微信小程序
CAIE 认证
CAIE 认证
CAIE认证
以上内容来自微信小程序

企业、高校及渠道合作

请联系微信:FYLlaoshi

图片

完 谢谢观看

确定要退出登录吗?
确定 取消
推广有奖