微信扫码
添加专属顾问
我要投稿
Agent Skills的本质是什么?这篇文章用第一性原理拆解了LLM的核心能力与Agent Skills的关系。 核心内容: 1. LLM的唯一核心能力是预测输出 2. Function Calling等功能的本质是特定格式的提示词 3. Agent作为代理如何连接用户与LLM能力
最近 Agent Skills 在网上炒得火热。
各种资源、各种教程、各种神奇的 Skill 分享,琳琅满目。
但你发现没有?看了一堆,还是云里雾里。
因为你没搞懂本质。搞不懂本质,你就只能一直索取别人的 Skills,永远是个"伸手党"。
今天,我用 1000 字讲清楚它的本质。
Anthropic(Claude 的开发商)是这么定义 Skill 的:
Agent Skills are modular capabilities that extend Claude's functionality.
翻译一下:Agent Skills 是扩展 Claude 功能的模块化能力。
补充解释是:
Each Skill packages instructions, metadata, and optional resources that Claude uses automatically when relevant.
关键词:扩展功能。
要理解"扩展",必须先理解"本体"——也就是 LLM 本身有什么功能。
从 2023 年火到现在,LLM 的核心能力其实只有一个:
预测输出。
你给它输入,它预测下一个 token,然后下一个,再下一个……直到输出完成。
就这么简单。
其他你听过的能力——什么 tools、function calling、联网搜索——本质上都是在这个能力上包了一层皮。
LLM 就是一个超级强大的"续写机器",所有花里胡哨的功能,底层都是让它"续写"出特定格式的内容。
既然说到 tools/function calling,有必要讲清楚。
这个功能其实就是一段提示词,大概长这样:
我有下面三个 tools:
- tool1: 功能1,参数1、参数2
- tool2: 功能2,参数1、参数2
- tool3: 功能3,参数1、参数2
当你解答问题 X 时,先检查 tools,看看哪个能解决。如果是 tool1,就返回
tool1(参数1, 参数2)这种格式。
实际还会复杂一些(tool id、多轮调用等),但本质就这样。
就是一段提示词,让模型按固定格式输出。
你看,LLM 开发商把常用能力包装成了 tools/function calling。叫什么名字随他们,你也拦不住。
有了上面的认知,我们来看 Agent。
LLM 开发商写了一个应用,这个应用调用"预测输出 + tools"的能力。可以是网页版,也可以是 Claude Code 这种 CLI 工具(终端,或称命令行)。
这个应用叫Agent。
Agent 这个词,准确翻译是"代理人、经纪人、媒介"。虽然现在大家喜欢叫"智能体",但"代理"更贴切。
代理什么呢?
代理你和 LLM 的交互周期。
原来,你需要:
prompt1 → 等 response1
根据 response1 补充 → prompt2 → 等 response2
根据 response2 补充 → prompt3 → 等 response3
……
直到第 5 轮,终于得到想要的结果 response5
而 Agent 让你只输入:
prompt1,中间全自动,直接拿到最终 response5。
Agent = 自动化循环 prompt 的人机中介。
到这里你已经理解了 70%。
现在你应该能猜到了。
Agent Skills = 把那些固化的流程、功能、注意事项,记录下来,打包成"技能包",方便以后复用。
就是这么简单。
你说不对,有些 Skill 能自动剪辑视频呢!怎么可能这么简单?
真是这么简单。
因为 LLM 知道怎么用某个 Python 库剪辑视频。它通过和 Agent 多次交互,在你本地部署这些库,编写脚本代码,然后执行。
整个过程你不会写代码、看不懂代码,但它就这样干了。
其他神奇的 Skill 也是如此。你觉得神奇,是因为你不知道网络上有现成工具能实现——而 LLM 知道。
举个例子。
我经常要评审公司的项目 SOW(.docx 文件),就跟 Agent 说:
帮我从项目计划、预算、验收和风险 4 个方面评审这个 SOW。
Agent 勤劳地做完了,效果可能还差点意思。毕竟它对我们公司理解有些,我给它的第一轮提示词也不完善。
于是,我继续补充:注意检查有没有日期、计划太紧张不合理的要提示出来。
Agent又勤劳的工作,直到我满意它的输出。
这时我说:把刚刚的过程提炼成 Skill。
然后它就生成对应格式的 Skill 文件。如果 Agent 不太"聪明",你就手动复制到指定文件夹。
下次再评审时,不用给重复的 prompt,你只要说评审这个SOW即可
你看,你完全不知道 .docx 文件是怎么被打开和解析的,你只要结果。过程保存为 Skill,下次直接用。
本质上就是这么简单。
Agent Skills 没有魔法。
它就是:提示词 + 固化流程 + 自动化调用。
揭开神秘面纱之后,你就能从"伸手党"变成"创造者"——自己根据需求,定制专属 Skill。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-04
刚刚,Xcode 史诗级更新:原生集成 Claude Agent SDK,苹果开发直接起飞!
2026-02-04
国产 Cowork 它来了!MCP、Skills和Expert Agents都支持,全部免费体验!
2026-02-04
混元研究博客上线姚顺雨团队最新成果:从 Context 探索语言模型的范式转变
2026-02-04
通俗讲解大模型短期记忆 vs 长期记忆
2026-02-04
谁动了我的电脑?谁应该抱怨?
2026-02-03
从 CLI 到桌面:Codex 把 coding agent 变成“任务指挥台”
2026-02-03
谷歌重大更新:国内手动开启 Gemini AI 侧边栏与 Auto Browse 自动浏览全攻略
2026-02-03
OpenAI 发布新的 Codex 桌面版,我现在不骂 Codex 难用了
2026-01-24
2026-01-10
2025-11-19
2025-11-13
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2026-01-09
2025-12-21
2026-02-04
2026-02-03
2026-02-03
2026-02-02
2026-02-02
2026-02-02
2026-01-31
2026-01-30