2026-03-09
为了帮助大家更好的了解、开发Skills,最近Anthropic发布了一份Claude官方开发指南。
这份指南一共分了七大核心模块,还有三份配套的参考清单,从基础原理到最后怎么分发共享,甚至遇到问题怎么排障都覆盖到了。
不管是想做单独的Skills,还是想结合 MCP 做更复杂的工作流,都能在里面找到对应的方法。

指南地址:https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf
下面【CAIE】就用大白话为大家解读一下这个指南,彻底搞懂Skills。
到底什么是Skills?
你可能见过很多Skills开源,也有人说它多么多么神奇好用,那Skills到底是个啥东西呢?
其实说白了,Skills不是什么复杂的程序,就是一个标准化的文件夹,里面装着让Claude执行特定任务的所有东西。
其中有一个必须有的核心文件叫SKILL.md,用Markdown写就行,里面还要加一点YAML的基础信息,剩下的就是几个可选的文件夹。
比如放Python、Bash这些可执行代码的scripts,放参考文档的references,还有放模板、图标这些素材的assets。

这种结构设计得特别巧,轻量还能随便拓展,也是它能跨平台用的关键。
不管是在Claude.ai网页端,还是Claude Code,甚至是用API调用,同一个Skills不用改任何东西,只要运行环境能满足依赖,就能直接用,这一点能省
设计Skills的三大核心原则
而设计Skills的核心有三个原则,这是所有操作的基础,摸透了这三点,做Skills就不会跑偏。
1. 渐进式披露
说白了就是Claude不会一次性把Skills的所有内容都加载出来,而是分三级来。
最外层的YAML基础信息会一直放在系统里,只告诉Claude这个Skills是干嘛的、什么时候该用,不占太多内存;等Claude判断当前任务需要这个Skills了,再加载SKILL.md里的完整指令;

如果还需要更详细的资料,再去翻文件夹里的其他附属文件。这样既保证了Claude能精准用Skills,又能减少令牌消耗,解决了大模型上下文不够用的老问题。
2. 可组合性
意思就是一个Claude能同时加载好几个Skills,而且这些Skills之间能配合工作。
不用想着自己做的Skills要独一份用,而是要考虑和其他Skills的兼容性,这样企业团队就能把不同的Skills拼起来,做出适合自己业务的复合型工作流,比如把文档创建和项目管理的Skills结合起来,一站式完成工作。
3. 可移植性
这个刚才也提了一嘴,就是跨平台通用,一次创建到处能用,不用为了不同的使用端反复修改,大大提升了Skills的复用价值,毕竟谁也不想做一次Skills,再为了网页端、API端各改一遍。
Skills与MCP的关系
这里还要说一下Skills和MCP的关系,很多朋友会把这两个搞混,指南里用了一个特别形象的比喻,一下子就懂了。
MCP就像是一个专业的厨房,给Claude提供各种工具、原料,让Claude能连接Notion、Asana这些第三方工具,还能获取实时数据、调用工具功能。
而Skills就是菜谱,告诉Claude怎么用这些工具和原料,一步一步做出想要的结果,把工作流和最佳实践都沉淀下来。
简单说,MCP决定了Claude能做什么,Skills则明确了Claude该怎么做。
如果只连MCP不加Skills,就会出现很多问题,比如用户连好之后不知道下一步该干嘛,客服总收到各种使用问题,每次和Claude对话都要从零开始说要求。
因为每个人的提示词不一样,结果也乱七八糟,甚至有人会觉得是MCP连接器不好用。
但配上Skills之后就不一样了,对应的工作流会自动激活,Claude用工具的方式会更稳定,最佳实践也会直接嵌在操作里,用户几乎不用学就能上手,学习曲线直接拉低。
开发Skills,设计环节是关键
做Skills的核心环节在规划和设计,这一步做不好,后面再怎么改都费劲。
指南里反复强调,别一上来就写代码、写指令,先想清楚这个Skills要解决什么实际问题,先定2-3个具体的用例,再开始后续的工作。
这一点真的太重要了,能避免做出来的Skills没用,白忙活一场。
如何定义用例?
定用例也有讲究,不是随便想一个就行,要明确触发条件、执行步骤和预期结果。
比如做一个项目冲刺规划的Skills,触发条件就是用户说帮我规划冲刺、创建冲刺任务这些话,执行步骤要明确先从Linear拿项目状态,再分析团队的工作速度和产能,接着建议任务优先级。
最后在Linear里创建带标签和预估时间的任务,最终的结果就是生成一个完整的冲刺规划,所有任务都安排好。想清楚这些,做出来的Skills才会精准落地,不会偏离需求。
Skills的三大类型
根据Anthropic的实践经验,Skills大概能分成三类,每一类的开发重点都不一样,大家可以对着自己的需求找方向。
第一类:文档和资产创建类
就是让Claude生成规范的文档、PPT、代码、设计图这些东西,不用借助任何外部工具,全靠Claude的原生能力就行。
开发这类Skills的关键,就是把样式指南、品牌标准嵌进去,做好标准化的模板,还有最终输出前的质量检查清单,保证每次生成的内容质量都在线,比如前端设计的frontend-design Skills就属于这一类。
第二类:工作流自动化类
适合那些需要多步骤操作,还得有标准化方法的流程,甚至能让多个MCP服务器配合工作。
比如做Skills的skill-creator工具本身就是这类Skills,它能一步步引导用户做新Skills,从定用例到写基础信息,再到写指令、验证,全流程都覆盖。
开发这类Skills,要做好分步的工作流,每一步都加验证环节,还要给通用的结构模板,内置审核和改进建议,让工作流能不断优化。
第三类:MCP增强类
核心是给MCP的工具访问能力加工作流指导,让Claude能更高效地用MCP连接的工具。
比如Sentry的代码审核Skills,能借助Sentry的MCP服务器,自动分析并修复GitHub里的代码漏洞。
这类Skills要做好的是多个MCP调用的顺序安排,把领域知识嵌进去,自动补充用户没说的上下文,还要处理好MCP使用中常见的错误,保证运行顺畅。
如何定义成功标准?
定好用例和类型后,还要定一个成功标准,不然不知道自己做的Skills好不好用。这个标准分量化和定性两方面:
量化标准:
定性标准:
这些可以通过自己测试、找朋友试用反馈来判断。
设计环节的硬性规则
当然,设计环节还有一些硬性的规则要遵守,不然后面上传都传不上去:
最关键的就是YAML里的基础信息,尤其是描述部分,直接决定了Claude能不能正确识别并触发Skills。
描述里必须同时说清Skills是干嘛的、什么时候该用,还要加一些用户平时会说的触发话,涉及到特定文件类型的也要提,字符数控制在1024以内,别用XML的标签。
比如做一个Figma设计文件分析的Skills,描述就要说清能分析Figma文件、生成开发交接文档,用户上传fig文件、要设计规范、做设计转代码交接的时候就触发,这样Claude才能精准识别。
写SKILL.md的技巧
写SKILL.md里的具体指令也有技巧,要具体、能落地,别写那些模棱两可的话:
测试迭代也很重要
做出来的Skills不能直接用,一定要测试和迭代,不然实际用的时候会出各种问题,体验特别差。
测试方法
指南里给的测试方法特别灵活,能根据自己的需求选,不用追求一刀切的严谨度:
还有一个特别实用的测试技巧,亲测有效,就是先盯着一个复杂的任务反复调,直到Claude能完美执行,再把这个成功的方法提炼成Skills,最后再扩展到其他测试用例。
这样能充分利用Claude的上下文学习能力,比一上来就全面测试效率高多了,也能更快找到Skills的问题所在。

测试的三个方面
测试主要看三个方面:触发、功能、性能,把这三点测透,Skills的基础就稳了。
1. 触发测试
看Skills能不能在该用的时候出来,不该用的时候不捣乱。比如做了一个ProjectHub的Skills,用户说搭建工作区、创建项目这些话要能触发,说查天气、写代码这些无关的话,就不能触发,还要试一下不同的说法,比如换个句式说创建项目,看能不能正常触发。
2. 功能测试
看Skills能不能做出正确的结果,比如测试创建5个任务的项目,给定项目名和任务描述后,Skills要能在平台上建好项目,5个任务的属性都正确,还能和项目关联起来,全程不能有API错误。
还要测一些边缘情况,比如输入的信息不完整、格式不对,看Skills的错误处理能不能生效,保证各种情况都能应对。
3. 性能对比测试
主要看开了Skills之后,工作流的效率有没有提升。对比开Skills和不开Skills的情况,看是不是能自动执行工作流,需要用户澄清的问题少不少,API调用有没有失败,消耗的令牌多不多。
一般来说,开了Skills之后,这些指标都会有明显的提升,不然这个Skills的价值就不大了。
skill-creator工具
这里还要提一下skill-creator这个工具,简直是做Skills的神器,能省大把时间。
在Claude.ai的插件目录就能找到,Claude Code也能下载用,只要告诉它你想做一个什么Skills,它就能根据你的描述生成规范的SKILL.md文件,还会建议触发的话和Skills结构。
做完之后,它还能帮你审核,指出哪里描述模糊、少了触发词、结构有问题,还会根据Skills的用途给测试用例。
如果用的时候发现了问题,比如某个边缘情况处理不好,把问题反馈给它,它还能帮你优化Skills,唯一的缺点就是不能自动跑测试套件,也给不了量化的测试结果,这部分还得自己来。
持续迭代优化
Skills做完上线后,也不是就完事了,还要根据实际使用的情况持续迭代:
5大好用开发模式
指南里还有一个特别实用的部分,就是从大量的实际开发案例里,提炼出了五个好用的Skills开发模式,不是硬性的模板,而是经过验证的方法,大家可以对着自己的需求选,不用再自己摸索。
不过选之前要先想清楚自己的Skills是问题导向还是工具导向:
多数Skills都会偏向一个方向,找对方向再选模式,就不会错。
模式一:顺序工作流编排
适合那些要按固定顺序做的多步骤流程,比如新客户的入职流程,先建账户,再设支付,然后创订阅,最后发欢迎邮件,每一步都调用对应的MCP工具,还要明确参数和等待条件。
开发关键: 把步骤顺序、步骤间的依赖关系说清楚,每一步都加验证,还要写好失败后的回滚方法,避免一步错步步错。
模式二:多MCP协同
适合那些需要多个第三方工具配合的工作流,比如设计到开发的交接流程,先在Figma里导出设计资产,再把资产存到Drive里,然后在Linear里创建开发任务,最后在Slack里发通知。
核心: 把每个阶段划分清楚,做好不同MCP之间的数据传递,进入下一个阶段前一定要验证,还要有集中的错误处理,不管哪个环节出问题,都能快速解决。
模式三:迭代优化
适合那些需要反复修改才能出好结果的场景,比如生成报告,先拿数据写初稿,再用脚本检查质量,找出问题后修改,改完再检查,直到达到质量要求,最后再做最终的格式调整。
开发关键: 定好明确的质量标准,做好迭代的循环,配好验证脚本,还要知道什么时候该停止迭代,不然会无限修改,浪费时间。
模式四:上下文感知的工具选择
适合同一个结果能用不同工具实现的场景,比如存文件,大文件用云存储,协作文档用Notion,代码文件用GitHub,临时文件用本地存储。
核心: 定好清晰的决策标准,比如多大的文件算大文件,什么类型的文件算协作文档,还要有备选方案,万一某个工具用不了,能快速换,还要跟用户说清楚为什么选这个工具,让用户明白背后的逻辑。
模式五:领域特定智能
适合那些需要专业领域知识的Skills,不只是简单调用工具,比如带合规要求的支付处理,处理前要先查制裁名单、验证司法管辖区、评估风险等级,合规了才能处理,还要做好完整的审计记录。
开发关键: 把领域的专业知识嵌到Skills的逻辑里,先做合规检查再操作,做好全面的文档记录,建立清晰的治理规则,保证操作符合行业规范。
常见Skills问题解决方法
咱们开发Skills的过程中,肯定会遇到各种问题,指南里把最常见的问题都整理好了,从上传失败到Skills不触发,再到MCP连接出错,都有对应的解决方法,相当于一个全场景的排障手册。
问题1:上传失败
问题2:Skills不触发
这是最常见的问题,核心就是描述部分没写好,要么太笼统,要么没加触发词,要么没提相关的文件类型。可以先问Claude什么时候会用这个Skills,Claude会把描述念回来,对着看哪里缺了信息,补上就行。
如果Skills触发太频繁,无关的查询也会出来,就把描述改得更具体,或者加一些排除的场景,明确Skills的使用范围。
问题3:MCP调用失败
如果Skills能加载,但MCP调用总失败,就一步步查:
问题4:Claude不按指令执行
Skills加载了,但Claude不按指令来,大概率是指令写得不好,要么太啰嗦,要么关键信息藏在后面,要么话讲得模棱两可。
解决方法:
问题5:Claude反应慢、回答质量下降
如果用Skills的时候发现Claude反应慢、回答质量下降,就是大上下文的问题,要么是Skills的内容太杂,要么是同时开的Skills太多,要么是没按渐进式披露的原则,一次性加载了所有内容。
解决方法:
写在最后
Anthropic这次发布的这份Claude Skills构建指南真的是太详细了,不只是把Skills开发的全流程拆解开了。更重要的是确立了AI定制化工作流的标准化体系,让AI能真正贴合每个人、每个团队的实际需求,落地到日常工作中。
无论你是Skills领域刚入门的小白还是有开发经验的老手,都能从这个指南中获得宝贵的学习经验。
想系统掌握AI核心技能、获取行业认可资质?
CAIE注册人工智能工程师认证
助你拓宽职业赛道,成为AI领域持证实力派

完 谢谢观看
