微信扫码
添加专属顾问
我要投稿
Agent Skills的本质是什么?这篇文章用第一性原理拆解了LLM的核心能力与Agent Skills的关系。 核心内容: 1. LLM的唯一核心能力是预测输出 2. Function Calling等功能的本质是特定格式的提示词 3. Agent作为代理如何连接用户与LLM能力
最近 Agent Skills 在网上炒得火热。
各种资源、各种教程、各种神奇的 Skill 分享,琳琅满目。
但你发现没有?看了一堆,还是云里雾里。
因为你没搞懂本质。搞不懂本质,你就只能一直索取别人的 Skills,永远是个"伸手党"。
今天,我用 1000 字讲清楚它的本质。
Anthropic(Claude 的开发商)是这么定义 Skill 的:
Agent Skills are modular capabilities that extend Claude's functionality.
翻译一下:Agent Skills 是扩展 Claude 功能的模块化能力。
补充解释是:
Each Skill packages instructions, metadata, and optional resources that Claude uses automatically when relevant.
关键词:扩展功能。
要理解"扩展",必须先理解"本体"——也就是 LLM 本身有什么功能。
从 2023 年火到现在,LLM 的核心能力其实只有一个:
预测输出。
你给它输入,它预测下一个 token,然后下一个,再下一个……直到输出完成。
就这么简单。
其他你听过的能力——什么 tools、function calling、联网搜索——本质上都是在这个能力上包了一层皮。
LLM 就是一个超级强大的"续写机器",所有花里胡哨的功能,底层都是让它"续写"出特定格式的内容。
既然说到 tools/function calling,有必要讲清楚。
这个功能其实就是一段提示词,大概长这样:
我有下面三个 tools:
- tool1: 功能1,参数1、参数2
- tool2: 功能2,参数1、参数2
- tool3: 功能3,参数1、参数2
当你解答问题 X 时,先检查 tools,看看哪个能解决。如果是 tool1,就返回
tool1(参数1, 参数2)这种格式。
实际还会复杂一些(tool id、多轮调用等),但本质就这样。
就是一段提示词,让模型按固定格式输出。
你看,LLM 开发商把常用能力包装成了 tools/function calling。叫什么名字随他们,你也拦不住。
有了上面的认知,我们来看 Agent。
LLM 开发商写了一个应用,这个应用调用"预测输出 + tools"的能力。可以是网页版,也可以是 Claude Code 这种 CLI 工具(终端,或称命令行)。
这个应用叫Agent。
Agent 这个词,准确翻译是"代理人、经纪人、媒介"。虽然现在大家喜欢叫"智能体",但"代理"更贴切。
代理什么呢?
代理你和 LLM 的交互周期。
原来,你需要:
prompt1 → 等 response1
根据 response1 补充 → prompt2 → 等 response2
根据 response2 补充 → prompt3 → 等 response3
……
直到第 5 轮,终于得到想要的结果 response5
而 Agent 让你只输入:
prompt1,中间全自动,直接拿到最终 response5。
Agent = 自动化循环 prompt 的人机中介。
到这里你已经理解了 70%。
现在你应该能猜到了。
Agent Skills = 把那些固化的流程、功能、注意事项,记录下来,打包成"技能包",方便以后复用。
就是这么简单。
你说不对,有些 Skill 能自动剪辑视频呢!怎么可能这么简单?
真是这么简单。
因为 LLM 知道怎么用某个 Python 库剪辑视频。它通过和 Agent 多次交互,在你本地部署这些库,编写脚本代码,然后执行。
整个过程你不会写代码、看不懂代码,但它就这样干了。
其他神奇的 Skill 也是如此。你觉得神奇,是因为你不知道网络上有现成工具能实现——而 LLM 知道。
举个例子。
我经常要评审公司的项目 SOW(.docx 文件),就跟 Agent 说:
帮我从项目计划、预算、验收和风险 4 个方面评审这个 SOW。
Agent 勤劳地做完了,效果可能还差点意思。毕竟它对我们公司理解有些,我给它的第一轮提示词也不完善。
于是,我继续补充:注意检查有没有日期、计划太紧张不合理的要提示出来。
Agent又勤劳的工作,直到我满意它的输出。
这时我说:把刚刚的过程提炼成 Skill。
然后它就生成对应格式的 Skill 文件。如果 Agent 不太"聪明",你就手动复制到指定文件夹。
下次再评审时,不用给重复的 prompt,你只要说评审这个SOW即可
你看,你完全不知道 .docx 文件是怎么被打开和解析的,你只要结果。过程保存为 Skill,下次直接用。
本质上就是这么简单。
Agent Skills 没有魔法。
它就是:提示词 + 固化流程 + 自动化调用。
揭开神秘面纱之后,你就能从"伸手党"变成"创造者"——自己根据需求,定制专属 Skill。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-21
编程选GPT-5.4,还是GPT-5.3-Codex?
2026-03-21
AI Coding前端实践后的复盘总结
2026-03-21
OpenAI 首席科学家:Codex 只是雏形,我们要造的是「全自动 AI 研究员」
2026-03-21
谷歌Stitch「氛围设计」干崩Figma 8.8%股价:十年经验,败给巨头一次更新(附实测)
2026-03-21
为什么 CLI 比 MCP 更适合 LLM
2026-03-21
渐进式披露(Progressive Disclosure):Agent 从 Demo 到企业级落地的 “救命架构”
2026-03-21
AI 编程工具怎么选?Codex 和 Claude Code 的本质区别
2026-03-21
Karpathy 最新播客:我得了 AI 精神病、App 将消失、Agent 将碾压实验室
2026-01-24
2026-01-10
2026-01-01
2026-01-26
2026-01-09
2026-01-09
2026-01-23
2025-12-30
2026-01-14
2026-01-21
2026-03-21
2026-03-20
2026-03-19
2026-03-19
2026-03-19
2026-03-18
2026-03-17
2026-03-17