免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

老板催着上Agent Skills,架构师:先冷静一下!

发布日期:2026-03-06 08:00:02 浏览次数: 1531
作者:弹壳AI

微信搜一搜,关注“弹壳AI”

推荐语

Agent Skills风靡一时,但盲目接入可能适得其反,看看架构师如何巧妙应对老板的急切需求。

核心内容:
1. 什么是Agent Skills及其实际应用场景
2. 架构师解析Skills接入的复杂性与前置工作
3. 通过虚构案例展示Skills的运作机制与价值

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

从年前开始,“Agent Skills”这个概念就火得一塌糊涂,OpenClaw爆火之后,更是成为行业焦点,最近不少一线主流的智能体应用、平台、框架都在争先适配接入。

本地源码方式部署OpenClaw,接入飞书,通过手机也能随时vibe coding了【保姆级教程】

但Skills到底是什么?某些业务场景真的适用吗?能否硬上?今天,我们通过一个虚构的办故事,来一探究竟。

在此声明:以下故事纯属虚构,好了,故事开始

一、什么是Agent Skills

刚刚,老板冲进办公室。“最近Skills很火,咱们那个智能体是不是也该把Agent Skills接进来?”

架构师老张不紧不慢地合上电脑,抬起头:“老板,先别急。要接入Skills,我们还有很多前置工作需要做。”

“不就是调个API吗?”老板一脸困惑。

老张笑了:“你想得太简单了。”

老张开始耐心解释:“我给你举个例子。想象一下咱们运维团队的日常工作:生产业务出问题,工程师得先排查原因——是网络问题,还是中间件、数据库崩了?是业务服务OOM,还是服务器硬件故障?这中间涉及一系列专业操作:搜错误码、查看系统日志、找修复脚本,如果是硬件故障还得协调供应商换件。这些操作流程、脚本工具、历史案例,如果能打包成一个结构清晰的‘技能包’,AI就能直接拿来用。”

他转身在电脑上敲出一段目录结构:

agent-skills/
├── SKILL.md                # 技能说明书
├── scripts/                 # 可执行脚本
│   ├── check_disk.sh
│   ├── restart_service.py
│   ├── analyze_log.py
│   └── backup_config.sh
├── references/              # 参考资料
│   ├── incident_cases.md
│   └── runbooks/
└── assets/                  # 静态资源
    └── config_templates/

“这个包就是一个Skills”老张敲了敲白板,“AI一开始只加载技能的‘名片’,也就是技能名称和描述元数据,确定要用这个技能后,才把完整的说明书读进来,然后Agent自主规划,思考,决策,调用合适的脚本工具。这种渐进式披露的机制,既节省计算资源(tokens),又能精准完成工作。”

组件
作用
SKILL.md
技能的名片和说明书,告诉AI这个技能的用途、限制和依赖环境
scripts/
存放所有可执行脚本,AI根据需要调用它们完成具体操作
references/
提供背景知识和历史案例,帮助AI更智能地决策
assets/
存放配置模板等静态文件,供AI在必要时参考或使用

“下次您只需要说一句‘MySQL数据库不能访问了,处理一下’,AI就会自动扫描所有技能包,找到匹配的‘MySQL数据库故障处理技能’,翻开SKILL.md了解规则,再根据实际情况调用scripts里的脚本、翻阅references里的案例,最后整合信息生成方案并执行。”

总监盯着屏幕,若有所思:“这听起来有点像工作流,但似乎更灵活?”

二、Skills vs Workflow

老张点点头:“确实,两者有本质区别。很多人容易混淆,我详细给你讲讲。”

“先说说咱们现有的工作流(Workflow)。比如处理数据库故障,我们定义了一个固定的流程:第一步检查网络,第二步检查数据库进程,第三步查看慢查询日志……每一步都是写死的,系统会按顺序执行。这种方式的好处是可控、稳定,适合那些规则明确、很少变化的重复任务。但缺点也很明显——一旦遇到流程之外的情况,比如磁盘满了导致数据库启动失败,它可能就卡住了,或者需要人工介入修改流程。”

“而Skills呢,是把这些能力打包成一个个技能包,Agent可以像人一样,根据实际情况自主决定怎么做。同样是数据库故障,Agent拿到‘数据库故障排查技能’后,会先看看SKILL.md里有没有特殊注意事项,然后根据当前错误信息,自主选择调用哪个脚本——如果报错是‘连接超时’,它可能先检查网络;如果报错是‘权限拒绝’,它可能去查references里的历史案例。整个过程是动态规划的,路径不固定,但目标一致。”

总监追问:“那具体从哪些维度来比较呢?”

老张在白板上画了个表格:

维度
Workflow
Agent Skills
设计哲学
预先定义好业务流程,在可控的范围内稳定执行
定义目标,规范能力卡片,写好详细操作说明书,提供所需工具脚本,执行时自主规划
决策方式
工作流逻辑决策
AI决策,基于上下文和推理
灵活性
低,难以处理未知情况
高,可根据实际情况动态调整步骤
维护成本
中高,业务变更通常需修改流程分支
低,可按需动态维护技能包来实现能力变更(如新增脚本)
开发成本与适用场景
需要设计完整的流程图,适合确定性的、输出一致性高、容错率低的场景
需要构建高质量技能包(文档+脚本),适合探索性场景
错误处理
通常有预设的异常分支,超出范围则失败
AI能根据错误自主调整策略,或调用其他技能辅助
资源消耗
一定程度上小模型也能驱动,最低执行开销小,但维护周期长
对模型能力要求高,需要强大模型驱动,推理成本高,但开发迭代更灵活

“我再举个具体例子。”老张喝了口水,“比如咱们要做一个‘服务器巡检’的任务。”

“如果用工作流,我们会这样设计:凌晨2点,执行脚本A检查CPU,脚本B检查内存,脚本C检查磁盘,然后把结果汇总成报告。每一步都是固定的,执行时也不会去思考‘是不是今天流量高峰需要重点关注某些指标’,它只会按部就班。”

“如果用Skills,我们会提供一个‘服务器巡检技能包’,里面包含各种检查脚本、历史故障案例、最佳实践文档。AI接到巡检任务后,会先判断当前时间、服务器角色、最近是否有变更,然后决定重点检查哪些项目。如果发现磁盘使用率偏高,它可能会主动去翻references里类似情况的处理记录,并在报告中给出建议。整个巡检过程就像有个资深工程师在亲自操作,灵活且有针对性。”

总监若有所思:“所以,Skills更像给AI装上了‘工具箱’和‘大脑’,让它自己判断该用什么工具、按什么顺序用,而不是我们替它画好路线图。”

“对!”老张赞许地点点头,“但厉害是厉害,要支持Skills是有门槛的。”

三、接入Skills的前置条件

“要保证Agent能读写文件(比如读取配置、写入结果)、执行脚本(如跑Python分析性能、自动更新系统)、调用系统命令(如安装依赖包、处理网络连接)。更重要的是,Agent必须具备自主规划、思考、决策、行动的能力。”

“说白了,您得把系统的‘钥匙’交给它。”

“而且,”老张继续说道,“这把钥匙可不是谁都能拿的。您得确保AI的‘大脑’足够聪明,小模型根本带不动。就算给它钥匙,它也不知道怎么开门。但话说回来,出于安全考虑,这把钥匙你敢轻易交给它吗?”

1. 模型能力要求

别指望用小模型玩Skills,我们需要:

  • • 工具调用能力:支持Function Call、MCP
  • • 长上下文支持:至少128k,否则无法处理复杂任务
  • • 强大的推理能力:能理解模糊目标,自主规划、思考、执行

“咱们现有模型能力似乎够呛,如果上生产,客户的预算够不够上顶配?”

2. 权限管控与安全边界

读写文件、执行脚本,意味着AI有动系统的能力。如果决定接入,就得建好“护栏”:

  • • 最小权限原则:只给必要的权限,如何界定权限边界?
  • • 沙箱隔离:限制操作范围,防止越界
  • • 高危操作人工确认:引入审核机制,关键操作需人批准
图片

“给的权限太高,如果真的AI误操作了,出现类似删库跑路这种安全事件,责任算谁的?”

3. 业务容错性

老张喝了口水,认真地说:“老板,我们不能盲目跟风,得结合咱们自身业务来思考。”

“自主决策的结果,有时会超出预期,让人眼前一亮;但有时也会离谱到家,让人哭笑不得。对于准确性要求极高的场景,如果它出了差错,咱们能承担得起后果吗?在系统运维里,处理非关键系统故障,偶尔小失误也许能接受;但如果是核心业务系统,一旦出错,可能影响业务系统运转。所以,要评估业务场景的容错性,确定是否适合引入Skills。”

写到最后

从上面的故事,可以了解到,要让Agent用好Skills,就必须给予它一定的权限、提供工具、赋予自主决策权。但这同时对我们提出了更高的要求:稳定的智能体框架、更强的模型、更严的权限管控,以及更理性的业务输出预期。

在决定接入之前,我们需要冷静评估自身的技术储备、业务需求和风险承受能力。正如老张所说:“想清楚为什么做,比怎么做更重要。”

Anthropic官方Skills仓库地址:https://github.com/anthropics/skills

往期回顾:

本地源码方式部署OpenClaw,接入飞书,通过手机也能随时vibe coding了【保姆级教程】

dify1.13.0低调发布,期待已久的HITL功能已上线!Agent Skills也快了吧?" data-itemshowtype="0" linktype="text" data-linktype="2">Dify1.13.0低调发布,期待已久的HITL功能已上线!Agent Skills也快了吧?

为什么通用大模型不知道“今夕是何年”?

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询