Skill 不是脚手架:读懂 SKILL.md 和仓库结构的正确姿势

简介: 本文剖析Skill本质:它不是“超级提示词模板”,而是Agent时代的可复用、可组合、可演进的能力单元。SKILL.md实为接口定义文件,需遵循元数据驱动、渐进式披露、目录分层设计。错误做法是堆砌600行“全能脚本”,正确路径是拆解为专注单一职责的轻量Skill——小粒度、高复用、易维护。

去年底我们团队开始用 Skills 的时候,有个人做了一个“全能测试 Skill”,把登录、下单、支付、退款全写进一个 SKILL.md 里,洋洋洒洒六百多行。跑的时候确实能工作,但每次都要加载全部内容,改一个支付逻辑要翻半天文档,想复用其中的登录步骤——不好意思,拆不出来。

这不是个例。很多人把 Skill 当“超级提示词模板”用,往一个文件里塞越多越好。本质上,他们把 Skill 当成了脚手架——一次性搭起来用完就拆的东西。

但 Skill 不是脚手架。它是可复用、可组合、可演进的能力单元。读不懂 SKILL.md 和仓库结构的设计意图,你就永远在“写提示词”而不是“构建能力”。

目录

一、SKILL.md 正在成为 Agent 时代的“接口定义文件”
二、本质不是提示词模板,是能力封装单元
三、拆解 SKILL.md:元数据是门面,正文是手册
四、拆解仓库结构:scripts、references、assets 各司其职
五、一个错误案例 vs 一个正确案例
六、对你意味着什么
七、最后问你一个问题
一、SKILL.md 正在成为 Agent 时代的“接口定义文件”
2025 年 10 月,Anthropic 推出了 Agent Skills 的概念。同年 12 月 18 日,它被正式发布为跨平台开放标准。

短短几个月,这个格式被 Claude Code、OpenCode、Cascade 等主流 Agent 框架广泛采纳。Anthropic 官方开源了 16 个生产级技能库,涵盖文档处理、创意设计、开发技术等领域。

这意味着什么?

SKILL.md 正在成为 Agent 时代的“接口定义文件”——就像 OpenAPI 之于 REST API、proto 之于 gRPC。它定义了一个 Agent 能力模块的边界、入口和调用方式。

但很多人还在用写 Prompt 的思路写 SKILL.md。把能塞的都塞进去,生怕 AI 漏掉什么信息。结果是:Skill 越来越臃肿,加载越来越慢,复用越来越难。

可以被截图传播的观点句 1:Skill 不是写出来的,是设计出来的。SKILL.md 不是提示词,是接口定义。

二、本质不是提示词模板,是能力封装单元
先看一个基础事实。

一个 Skill 本质上就是一个包含 SKILL.md 文件的文件夹。SKILL.md 使用 YAML frontmatter + Markdown 正文的格式。

但“本质上是什么”和“实际该怎么用”是两回事。

很多人把 Skill 当成“高级提示词模板”——把原本要复制粘贴给 AI 的一大段话,放进一个文件里,然后让 AI 自动读取。

这个理解只对了一半。

Skill 和提示词模板的核心区别在于三点。

第一,Skill 是可发现的。 Agent 启动时只加载所有 Skill 的元数据(name 和 description),而不是完整内容。AI 通过元数据判断“这个 Skill 跟我当前的任务有没有关系”,有关系才加载正文。提示词模板没有这个发现机制——你得手动选、手动贴。

第二,Skill 是可组合的。 一个 Skill 可以调用另一个 Skill 的输出,可以串联成工作流。提示词模板之间没有这种依赖关系。

第三,Skill 是可版本化的。 Skill 就是文件夹里的文件,可以 Git 管理、可以 Code Review、可以 CI 校验。提示词模板散落在聊天记录和文档里,没人管版本。

本质上,Skill 解决的是能力复用的问题——把“怎么做一件事”固化成可被 AI 自动发现、自动加载、自动执行的标准模块。

可以被截图传播的观点句 2:提示词模板是给人看的说明书,Skill 是给 AI 用的能力包。两者差了一个工程化的维度。

三、拆解 SKILL.md:元数据是门面,正文是手册
3.1 YAML frontmatter:决定 AI 会不会用你
SKILL.md 的开头是 YAML frontmatter,用 --- 包裹。

最少需要两个字段:


name: api-test-generator

description: 根据 OpenAPI/Swagger 文档自动生成 API 测试用例。当用户提到"接口测试"、"API测试"、"生成测试用例"时使用。

name 是 Skill 的唯一标识符,必须和文件夹名称一致。

description 是 AI 判断“要不要加载这个 Skill”的核心依据。AI 启动时只看到这个 description,不看正文。description 写不好,Skill 永远不会被加载。

好的 description 长什么样?

包含触发短语:把用户可能说的话写进去
定义使用场景:说明什么时候该用、什么时候不该用
包含关键词:让 AI 在语义匹配时能命中
差的 description 只有一句话“帮助做 API 测试”。AI 根本不知道什么时候该调它。

可选的扩展字段还包括 allowed-tools(声明需要的工具权限)、references(声明最重要的参考文档)等。

3.2 Markdown 正文:让 AI 知道怎么执行
frontmatter 之后是 Markdown 正文。这是 Skill 的“操作手册”。

正文写什么?核心就三件事:

目标与边界:这个 Skill 做什么、不做什么
执行步骤:具体的操作流程,可以是线性步骤、决策树或循环迭代
输入输出规范:需要什么数据、产出什么结果
正文应该尽量精炼。不是把所有能写的都写进去,而是只写 AI 必须知道的执行逻辑。更长的参考资料放在 references/ 目录下,按需加载。

3.3 渐进式披露:三层加载模型
这是 Skill 设计最核心的机制。

bbd75b55-6526-41a6-88a7-9b8b26e1e2ad.png

这个设计解决了什么问题?

上下文不膨胀:即使你有几十个 Skill,初始也只加载元数据,不占上下文
加载更精准:只加载当前任务相关的 Skill 内容
支持海量信息:Skill 可以包含大量脚本和文档,但只在需要时加载
很多人把几百行内容全塞进 SKILL.md 正文,破坏了渐进式披露的设计意图。正确的做法是:正文只写核心执行逻辑,细节放 references,脚本放 scripts。

四、拆解仓库结构:scripts、references、assets 各司其职
一个标准的 Skill 仓库长这样:

my-skill/
├── SKILL.md # 必需:元数据 + 核心指令
├── scripts/ # 可选:可执行脚本
├── references/ # 可选:参考文档、规范、知识材料
└── assets/ # 可选:模板、图片、资源文件
每个目录有明确的职责。

scripts/ 存放可执行脚本——Python、Bash、JavaScript 等。Agent 可以直接运行这些脚本,把结果拿回上下文。脚本代码本身不占用上下文 token,只有执行结果进入上下文。这是 Skill 承载“确定性能力”的关键——复杂计算、数据清洗、文件操作,交给脚本,而不是让 AI 猜。

references/ 存放参考文档——详细的规范、长篇幅的风格指南、政策文档等。这些内容只在需要时被引用加载。不要在 SKILL.md 正文里塞几千字的规范,放 references,按需取用。

assets/ 存放静态资源——模板文件、图片、样例数据等。Agent 生成内容时可以直接引用这些模板。

这三层目录加 SKILL.md 本身,构成了一个完整的“渐进式披露”体系:

SKILL.md 元数据 = 第一层(发现)
SKILL.md 正文 = 第二层(执行)
scripts/references/assets = 第三层(按需加载的深层资源)
目录结构不是装饰,是渐进式披露的物理载体。

五、一个错误案例 vs 一个正确案例
错误案例:把 Skill 当脚手架

有个团队写了一个“电商全流程测试 Skill”,SKILL.md 正文 600 多行,包含了登录、搜索、加购、下单、支付、退款的全部步骤描述和断言规则。

问题:

每次加载消耗大量 token,即使只测登录也要加载全部
支付接口变了,要在大段文字里找对应的描述位置
想单独复用“登录”步骤?拆不出来,因为和其他步骤耦合在一起
正确案例:把 Skill 当能力单元

另一个团队的做法是拆成 6 个独立的 Skill:

login/
├── SKILL.md # 只描述登录
add-to-cart/
├── SKILL.md # 只描述加购
create-order/
├── SKILL.md # 只描述下单
...
每个 SKILL.md 正文控制在 50-80 行,只写本 Skill 的核心逻辑。通用的校验规则放在 references/,可复用的脚本放在 scripts/。

效果:

每个 Skill 加载快,token 消耗低
改支付只改 payment/ 一个文件夹
6 个 Skill 可以任意组合成不同场景
核心区别:错误案例把 Skill 当成“一次性搭好的完整流程”,正确案例把 Skill 当成“可组合的乐高积木”。

可以被截图传播的观点句 3:Skill 的粒度应该小到你可以确信它只做一件事,而且这件事可以被其他 Skill 复用。

六、对你意味着什么
对在校生

你现在看到的 SKILL.md 格式,正在成为 Agent 生态的“通用语”。就像几年前学 JSON 和 YAML 是基本功一样,理解 SKILL.md 的结构设计——元数据驱动发现、渐进式披露、目录分层——会让你在未来两三年里比别人更早看懂行业的变化方向。不需要写得多好,但需要看得懂、知道“为什么这么设计”。

对初级工程师

你可能已经在用现成的 Skills 了。但如果你只会用不会写,或者只会往一个 SKILL.md 里堆内容,那你还没真正掌握这个工具。核心能力不是“写提示词”,而是“做封装设计”——判断一个能力的边界在哪、应该拆多细、哪些放正文哪些放 references。这个能力比会写代码更重要。

对中级工程师

你面临的问题是团队级别的 Skill 资产管理。当团队有几十个 Skill 时,怎么保证它们不冲突、可组合、可演进?答案在于契约设计——每个 Skill 的输入输出要明确,依赖关系要清晰,目录结构要统一。把这些规范沉淀下来,比写 20 个 Skill 更有价值。

七、最后问你一个问题
打开你最近写的一个 SKILL.md,看一眼它的正文长度。

如果超过 200 行,问自己一个问题:这里面有多少内容是“核心执行逻辑”,有多少是“参考信息”?

如果参考信息占了大部分,你其实没在用 Skill 的渐进式披露能力——你只是在写一个长文本提示词,然后给它披上了 SKILL.md 的外衣。

你现在的 Skill,是能力单元还是长提示词?留言聊聊你的判断。

相关文章
|
11天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
11天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
844 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
11天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
857 7
|
11天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
11天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
2313 6
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
11天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
1881 6
|
11天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
785 150
|
11天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
633 2