微信扫码
添加专属顾问
我要投稿
让AI Agent从聊天助手升级为标准化生产力工具,Agent Skills是关键一步,解决重复解释规则、输出不稳定和团队协作难题。核心内容: 1. Agent Skills的定义与核心价值:模块化能力包,实现任务SOP标准化 2. 与Prompt的五大本质区别:从便签纸到员工手册的进化 3. 实战案例展示:如何用Skills实现研究报告自动化生产
>>>本系列视频课程已在我的B站(🔍唐国梁Tommy)上线,复制以下链接或点击文末“阅读原文”即刻开始学习。
【Agent Skills 实战教程:如何让 Agent 按需加载知识?渐进式披露完整流程|Agno Skills工作流全链路解析】
https://www.bilibili.com/video/BV1yUfnBjEu2/?share_source=copy_web&vd_source=44de46517e4609888d4085939ef749f4
你可能也遇到过这类问题:
如果你想让 AI Agent 从“会聊天”变成“能干活、可交付、可迭代”的生产力系统,Agent Skills 是最关键的一块拼图。
先给一个最简定义:
Skill = 可发现、可按需加载的任务 SOP 模块(能力包)。
它不是一段提示词,它是一个产品化的能力单元——包含了元数据、执行指令、示例模板、校验规则,甚至可以带脚本和参考文档。
用 Anthropic 官方的话说:Skills 是用于扩展 AI Agent 功能的模块化能力包。每个技能以文件夹形式存在,包含指令、元数据和可选的资源文件。当 Agent 判断某个技能与当前任务相关时,会自动加载并使用。
一句话总结:Prompt 是便签纸,Skill 是员工手册。
假设你经常做 “某个热点方向的研究报告(调研→对比→结论→路线图)”:
没有 Skill 的时候:
“请帮我做一份研究报告。要求:先给出 1 页 TL;DR;再按‘背景/问题定义/技术路线/关键论文与方法对比/数据与评测/落地应用/风险与局限/未来趋势’分章节;对每条路线给优缺点表格;最后给 3 条可执行建议和一个 90 天路线图。写作要偏工程落地,不要空泛,还要保留引用格式……”
每次都要把报告结构、对比维度、写作口径、交付物格式重新讲一遍,稍不注意就会变成“堆概念、没结论”。
有 Skill 的时候:
/research-report [主题] [目标读者] [时长/深度]
一句话搞定。因为所有规则已经封装在 Skill 里:
金句:Skill 的本质,是把个人经验变成组织资产。
很多人卡在这里:到底什么时候用 Prompt?什么时候用 Tool?MCP 又是什么?
很多人搞不清 Prompt、Tool、Skill、MCP 这四个东西的边界。
一个清晰的四分法:
| Prompt | |||
| Tool | |||
| MCP | |||
| Skill |
Skill 负责 How(流程与规范),MCP 负责 What/Where(数据与动作)。
两个秒懂场景
场景 1:"帮我生成本周周报"
这更像 Skill。因为你需要的是一套固定流程:
*先从任务记录里提取本周完成的事项
*按模板分"本周完成 / 下周计划 / 风险事项"三段
*输出格式是 Markdown,口吻要职业化
这些"怎么做"的规范,就是 Skill 的活儿。
场景 2:"从 Jira 里拉取本周的任务列表"
这更像 MCP。因为你需要的是:
*连接到 Jira 的 API
*用我的账号鉴权
*拉取指定时间范围的 ticket
这些"去哪里连、拿什么数据",就是 MCP 的活儿。
| 定位 | ||
| 实现方式 | ||
| 部署 | ||
| 交互 | ||
| 适用场景 |
最强大的组合是:MCP 提供数据和工具 → Skill 提供 SOP → Agent 执行闭环。
比如:
金句:Skill 教 AI 怎么干活,MCP 帮 AI 连接世界。
Skill 的关键不是“写得长”,而是“不要一次性塞满上下文”。
用“渐进式披露(Progressive Disclosure)”来解释:
需要什么给什么,不需要的不加载。
传统方式(全量加载):
Skills 按需加载方式:
这是 85% 的 token 节省!
而且不只是省 token——准确率也提升了。根据 SkillPort 的测试数据:
❌ 错误示范:把 3,000 行编码规范直接塞进 system prompt
✅ 正确做法:把规范封装成 Skill
一个很关键的设计细节:Skills 的选择完全靠 LLM 自身的推理能力,没有算法路由,没有意图分类器,没有语义搜索。
流程是这样的:
这意味着:description 写得好不好,直接决定了你的 Skill 能不能被正确触发。
金句:三层加载 = 最小信息做判断 + 按需加载做执行 = 省上下文 + 更稳定。
Skill 的最小形态其实很朴素:一个文件夹 + 一个 SKILL.md 文件(左滑查看)
my-skill/
└── SKILL.md ← 这一个文件就够了
复杂一点的 Skill 可以有更多文件:(左滑查看)
my-skill/
├── SKILL.md # 必需:技能定义
├── scripts/ # 可选:可执行脚本
│ └── validator.py
├── references/ # 可选:详细参考文档
│ └── REFERENCE.md
└── assets/ # 可选:模板和静态资源
└── template.md
SKILL.md 由两部分组成:
第一部分:YAML Frontmatter(元数据区)(左滑查看)
name: agent-design-reviewer
description: >
用于生成“Agent 系统设计评审包”。当用户提供一个 Agent 项目想法或现有方案
(目标、工具、数据源、约束、指标)时使用;自动输出:系统架构图、模块拆解、
风险清单、评测方案与里程碑计划。不适用于单纯写代码或逐段翻译说明文档。
---
第二部分:Markdown 正文(执行指令区)(左滑查看)
## 执行步骤
1. 需求澄清:目标用户/核心任务/输入输出/成功指标(若缺失先列出缺失项)
2. 任务分解:把目标拆成 3-7 个子任务(可工具化/可评估)
3. 架构设计:输出端到端架构(Agent Loop:Think→Plan→Act→Observe→Reflect)
4. 模块拆解:Planner / Tools / Memory / Retriever / Evaluator / Guardrails
5. 风险与边界:失败模式(幻觉、工具误用、权限、数据泄露、成本、延迟)
6. 评测方案:离线集 + 在线集 + 指标(成功率/成本/时延/引用正确率/鲁棒性)
7. 交付计划:30/60/90 天里程碑(PoC→MVP→Prod),每阶段验收标准
## 输出模板
### TL;DR(10 行内)
- 做什么:
- 给谁用:
- 成功标准:
- 关键差异点:
### 架构图(Mermaid)
```mermaid
flowchart LR
U[User] --> P[Planner]
P --> T[Tool Router]
T -->|Call Tools| X[(Tools/MCP)]
X --> O[Observe]
O --> M[Memory/Retrieval]
M --> P
P --> A[Answer]
## 模块清单(职责与接口)
模块 输入 输出 关键设计点 可替代方案
## 风险清单(Failure Modes)
- 幻觉风险:如何降低(证据引用/自检/多样性采样)
- 工具风险:参数错误/误调用(权限分级/工具白名单)
- 成本风险:token/工具调用频率(缓存/批处理/早停)
- 数据风险:敏感信息(脱敏/审计/最小权限)
## 评测与验收
- 离线:固定测试集(任务成功率、引用正确率、步骤长度、成本)
- 在线:A/B(用户满意度、完成时长、复访率)
- 失败回放:日志字段规范(trace_id、tool_calls、evidence)
## 30/60/90 天计划
- 30 天:PoC(核心链路跑通 + 基线指标)
- 60 天:MVP(覆盖主要任务 + 失败回放闭环)
- 90 天:Prod(权限治理 + 监控报警 + 成本优化)
name |
/name 斜杠命令 |
|
description |
||
allowed-tools |
"Read,Write,Bash" |
|
model |
||
version |
||
disable-model-invocation |
/name 调用 |
description 是决定触发率的关键。推荐用这个公式:
当用户要做【任务 A / 任务 B】并且需要【输出格式/目标】时使用;当【反例场景】不要使用。
✅ 好的 description 示例:(左滑查看)
description: >
从 PDF 文件中提取文本和表格,填写 PDF 表单,合并多个 PDF。
当需要处理 PDF 文档或用户提到 PDF、表单、文档提取时使用。
❌ 差的 description 示例:
description: 帮助处理 PDF。
差在哪?
这是一个最简的可运行 Skill:(左滑查看)
---
name: code-explainer
description: >
用直观类比和 ASCII 示意图解释代码如何运行。
当用户问"这段代码怎么工作""帮我解释这个函数"时使用。
---
当解释代码时,请遵循以下步骤:
1. **类比说明**:先用日常生活中的事物作比喻
2. **绘制示意图**:使用 ASCII 图形绘制代码流程
3. **逐步讲解**:逐行解释代码执行过程
4. **提示注意**:指出一个常见的陷阱或误区
用对话的口吻给出解释,复杂概念可以使用多个类比。
金句:name 决定你怎么调用它,description 决定 AI 什么时候自动用它。
会写 Skill 只是第一步,写好 Skill 才是关键。这里分享经过多个生产级项目验证的最佳实践。
规则 1:多给 examples(好结果长什么样)
这是 Supabase Agent Skills 项目总结出来的"对比学习模式":
每条规则都要有"错误示范"和"正确示范"。
比如你写一个 SQL 优化 Skill,不要只说"应该用索引",而是:
Incorrect (缺少索引导致全表扫描):(左滑查看)
SELECT * FROM orders WHERE customer_id = 123;
-- 没有索引时:Seq Scan,2500ms
Correct (添加索引后的高效查询):(左滑查看)
CREATE INDEX orders_customer_id_idx ON orders (customer_id);
SELECT * FROM orders WHERE customer_id = 123;
-- 有索引后:Index Scan,2.3ms,提升 1087x
为什么这么做?因为 AI 通过"对比"学得最快。看到了错误模式,它才能在用户代码中识别出同样的问题。
规则 2:把复杂内容下沉到 references
SKILL.md 正文建议控制在 5,000 tokens 以内。超出的内容放到 references/ 目录,在正文中用链接引用:(左滑查看)
## 详细规范
基础用法见上述步骤。更多高级配置请参阅:
- [表单处理指南](references/FORMS.md)
- [API Schema 说明](references/api-schema.json)
这样 Agent 只在需要时才加载详细文档,不会一上来就塞满上下文。
规则 3:加输出校验清单
在 Skill 末尾加一个 checklist,让 Agent 在输出前自检:
## 输出校验清单
- [ ] 输出格式是否符合模板
- [ ] 是否包含所有必需字段
- [ ] 语气是否一致(口语化 vs 书面)
- [ ] 代码示例是否可运行
- [ ] 是否有遗漏的边界情况
来自 Anthropic 官方 Skills 仓库的开发建议:
像管理代码一样管理 Skill:
version 字段金句:Skill 的迭代方式更像写库/写组件,而不是写提示词。
最后是整套系统的“闭环组合范式”:
一句话:MCP 给 Agent 连上"手和眼",Skill 给 Agent 装上"脑"。
👉如果你想系统掌握多模态大模型前沿技术与应用,推荐你学习我的精品课程:
📚课程覆盖主流多模态架构、多模态Agent、数据构建、训练流程、评估与幻觉分析,并配套多个项目实战:LLaVA、LLaVA-NeXT、Qwen3-VL、InternLM-XComposer(IXC)、TimeSearch-R视频理解等,包含算法讲解、模型微调/推理、服务部署、核心源码解析。
💡本课程目前正在更新中,你可以在我的个人官网或B站课堂参与学习:
📺B站课堂(🔍唐国梁Tommy)https://www.bilibili.com/cheese/play/ss33184
🌐官网链接(国内访问需科学上网):https://www.tgltommy.com/p/multimodal-season-1
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业