2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

一套Skills库干掉30%手工测试,老板已经在问了

发布日期:2026-05-06 08:06:58 浏览次数: 1798
作者:霍格沃兹测试学院

微信搜一搜,关注“霍格沃兹测试学院”

推荐语

这套Skills库让测试团队效率飙升30%,AI自动化处理手工测试的繁琐环节,释放人力做更有价值的工作。

核心内容:
1. Skills库如何将手工测试时间减少30%
2. Skill库的三层架构与能力复用机制
3. 从0到1搭建Skill库的实战指南

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


上个月技术复盘会,老板突然问了一个让所有测试组长后背发凉的问题:

“听说隔壁团队搞了一套什么Skills库,手工测试量直接砍掉30%?我们什么时候也能这样?”

会议室安静了三秒。

没人敢接话。因为大家心里清楚,自己团队还在手工点来点去,偶尔写几个半自动脚本。隔壁的“Skills库”三个字,像一根刺扎在每个人心里。

会后我专门去聊了一下。隔壁测试负责人很坦诚:不是什么黑科技。就是把团队最常做的20个手工操作,写成了AI能调用的Skill。现在测试人员只需要说人话,AI就自动把数据造好、环境配好、断言写好、报告发好。

不是人变强了。是Skill让AI变强了。

今天把这套方法论拆开,不讲概念,直接讲怎么建、怎么用、效果怎么来的。

目录

一、手工测试的30%到底去哪了 二、Skill不是技术债,是能力复用 三、Skill库的三层架构 四、一个真实的效果对比 五、从0到1搭建你的第一个Skill库 六、Skill库会成为测试团队的“军火库”

一、手工测试的30%到底去哪了

先看一个真实数据。

某中型互联网公司的测试团队,12个人,每月投入约1800人时。做了三个月Skill库建设后,同样12个人,同样的业务量,手工测试时长降到了1260人时。

省下来的540人时去哪了?不是裁员,是把人从“搬砖”里解放出来,去做探索性测试、风险分析、流程优化。

省在哪几个环节?

数据准备。以前测一个下单流程,需要手工构造不同状态的用户、不同折扣的商品、不同时效的地址。一个场景准备5分钟,一天跑20个场景就是100分钟。现在Skill自动生成,10秒。

环境切换。测完测试环境要切预发,换配置、改hosts、重启服务。一套下来10分钟。现在Skill一键切换,5秒。

结果验证。跑完用例要看日志、查数据库、比对响应。以前人力翻,现在Skill自动聚合,3秒出报告。

缺陷复现。发现一个偶现Bug,以前要记下操作步骤,手工复现。现在AI Agent录屏+自动回放,一键复现。

这些环节加起来,占一个测试工程师日常时间的30%到40%。不是技术含量高的活,是体力活。

Skill做的事:把这些体力活封装成AI能理解、能调用的能力模块

可以截图传播的观点句1:Skill库解决的不是“测不准”,是“测不完”。

二、Skill不是技术债,是能力复用

很多人一听Skill,第一反应是“又要写一堆代码,维护成本爆炸”。

错。

传统自动化的问题是:每个项目、每个场景都要重新写脚本。换个业务线,登录逻辑不一样,脚本就得重写。换套环境,配置不一样,脚本又得改。维护成本线性增长,最后烂尾。

Skill的底层逻辑不一样。

本质是:把“原子能力”封装成一次,让AI在不同场景里编排复用。

一个例子。登录Skill。

不管什么项目、什么环境,登录的本质是一样的:输入账号密码,点按钮,拿token。差异在于:不同项目的认证接口地址不同、参数名不同、加密方式不同。

你不需要为每个项目写一套登录脚本。你写一个通用的“登录Skill”,把变化的部分做成可配置的参数。Agent调用时,根据当前项目的配置文件,动态填充。

一个Skill写一次,20个项目都能用。

另一个例子。造数Skill。

测试需要各种用户:已实名、未实名、有订单、无订单、黑名单用户。你不需要为每种用户写造数脚本。你写一个“用户构造Skill”,输入条件是“用户类型+附加属性”,Skill内部调用工厂模式生成。Agent理解自然语言“造一个上海地区的黑名单用户”,自动翻译成Skill的输入参数。

Skill库里放的不是脚本,是能力单元。能力单元可以组合、可以配置、可以被AI调度。

维护成本不是线性增长,是接近常数级。因为新业务来了,不需要写新Skill,只需要配新参数。

可以截图传播的观点句2:Skill库的本质是测试能力的“函数化”——写一次,调用无限次。

三、Skill库的三层架构

要建一个能干掉30%手工测试的Skill库,不能是散装脚本。需要三层结构。

下图是成熟Skill库的架构:

┌─────────────────────────────────────────────────────────┐
│                   编排层 (Orchestration)                 │
│                 AI Agent / 测试编排器                    │
│     理解自然语言 → 拆解任务 → 调度Skill → 聚合结果        │
└─────────────────────────────────────────────────────────┘
                              │
                              ▼ MCP / API
┌─────────────────────────────────────────────────────────┐
│                   能力层 (Capabilities)                  │
├─────────────┬─────────────┬─────────────┬───────────────┤
│  数据Skill  │  环境Skill  │  执行Skill  │  断言Skill    │
│  造数/脱敏  │  切换/初始化 │  调用/模拟   │  校验/比对    │
└─────────────┴─────────────┴─────────────┴───────────────┘
                              │
                              ▼
┌─────────────────────────────────────────────────────────┐
│                   资源层 (Resources)                     │
│      配置文件 / 测试数据池 / Mock服务 / 日志存储          │
└─────────────────────────────────────────────────────────┘

第一层:资源层。

存放所有静态资源。数据库连接配置、环境变量、测试数据模板、Mock规则。Skill不硬编码任何值,运行时从资源层读取。修改配置不需要改Skill代码。

第二层:能力层。

核心Skill本体。每个Skill只做一件事。数据Skill负责生成或脱敏数据;环境Skill负责切换环境或重置状态;执行Skill负责调用被测接口或模拟操作;断言Skill负责比较实际结果和预期。每个Skill有明确的输入输出Schema,可以被AI自动发现和调用。

第三层:编排层。

AI Agent或轻量级编排器。接收自然语言指令,拆解成Skill调用序列,处理Skill之间的数据传递,最后汇总结果。这一层不需要测试工程师写代码,AI自动完成。

三层各司其职。资源层让Skill配置化,能力层让Skill可复用,编排层让Skill可被AI驱动。

解决了什么问题?新人加入团队,不需要熟悉20个脚本的代码逻辑。只需要知道“有哪些Skill、每个Skill能干什么”。说人话,AI帮你排。

四、一个真实的效果对比

用真实的回归测试场景对比。

场景:一个电商订单模块,每次发版前需要回归20个核心用例。包括正常下单、优惠券抵扣、库存扣减、支付回调、订单取消、退款。

传统手工测试:

  • 准备数据:每个用例需要特定状态的商品、用户、优惠券。手工在后台配置,平均每个用例准备3分钟。20个用例 = 60分钟。
  • 执行用例:手动操作前端或调用接口,记录结果。每个用例执行2分钟,20个 = 40分钟。
  • 验证结果:查订单状态、查库存变化、查资金流水。每个用例验证3分钟,20个 = 60分钟。
  • 总耗时:60 + 40 + 60 = 160分钟,约2.5小时。加上报告整理,3小时。

Skill库 + AI Agent:

  • 测试人员输入:“回归订单模块20个核心用例”。
  • Agent自动识别需要调用的Skill:数据构造Skill(批量20个场景数据)→ 环境准备Skill → 接口调用Skill → 断言Skill(多维度校验)→ 报告生成Skill。
  • Agent并行调度。数据构造在后台批量跑,20个用例的数据5秒生成。接口调用也是并发,20个接口5秒返回。断言异步校验,同时查数据库和日志。
  • 总耗时:从指令发出到收到报告,约45秒。其中包括Agent规划时间、Skill执行时间、结果聚合时间。

对比结果:3小时 vs 45秒。差距是240倍。

但重点不是时间。重点是测试人员在这45秒里在做什么?在思考“有没有遗漏的场景”“这次变更影响哪些边界”。这才是人的价值。

可以截图传播的观点句3:Skill库不是为了取代测试工程师,是为了让测试工程师不再做机器能做的事。

人工智能技术学习交流群

伙伴们,对AI测试、大模型评测、质量保障感兴趣吗?我们建了一个 「人工智能测试开发交流群」,专门用来探讨相关技术、分享资料、互通有无。无论你是正在实践还是好奇探索,都欢迎扫码加入,一起抱团成长!期待与你交流!👇


图片


五、从0到1搭建你的第一个Skill库

不用一步到位。按优先级迭代。

Phase 1:选最痛的三个点(第1-2周)

盘点团队手工测试里最耗时、最重复、最容易出错的三个任务。大概率是:造测试数据、环境切换、多字段断言。

对每个任务,写一个Skill的原型。数据Skill用Faker库,环境Skill用shell脚本封装,断言Skill用deepdiff。先不追求优雅,跑通就行。

Phase 2:统一Skill规范(第3-4周)

确定Skill的输入输出格式。推荐JSON Schema。每个Skill必须包含:

  • name:唯一标识
  • description:一句话说清楚能力
  • input_schema:参数的类型、是否必填、取值范围
  • output_schema:返回值的结构

同时建立Skill注册表。可以是一个Git仓库,每个Skill一个目录,包含代码、配置、README。

Phase 3:引入AI编排(第5-8周)

选一个支持MCP协议的Agent框架。开源的有OpenClaw、Claude Code。把你的Skill注册到MCP Server上。

测试AI编排的效果。给一个复合任务,比如“测试登录接口,用5组异常密码,断言返回码是401,输出报告”。看Agent能否自动拆解并调用数据Skill、接口调用Skill、断言Skill、报告Skill。

Phase 4:迭代和共享(持续)

收集Agent调用失败的case。多数是因为Skill的description写得不清晰,模型不知道什么时候该调用。优化描述,加更多示例。

把高频使用的Skill组合成模板。比如“回归测试模板”预置了数据准备→执行→断言→报告的四步流程,测试人员只需填参数。

团队内定期评审Skill库。哪些Skill使用率低?是不是接口不友好?哪些新需求值得封装成Skill?

工程实践建议:Skill的粒度不要太大。一个Skill只做一件事,比如“生成手机号”和“校验手机号”分开。组合由AI在编排层完成。细粒度Skill复用率更高。

六、Skill库会成为测试团队的“军火库”

三个趋势已经很明显。

第一,Skill库从“可选项”变成“基础设施”。

2026年的测试团队,没有Skill库就像没有Git一样奇怪。新项目启动,第一件事不是写测试计划,是问“我们有哪些现成的Skill可以用”。

第二,Skill的复用跨越项目和公司边界。

腾讯的SkillHub已经开放了超过28000个Skill。你写的一个造数Skill,如果通用性足够好,可以被其他公司的测试团队使用。Skill会成为技术影响力的一种新形式。

第三,测试工程师的分工变化。

未来测试团队里的角色:Skill工程师(封装能力)、Agent编排师(设计自动化流程)、业务测试专家(定义测什么、判对错)。传统手工执行者的岗位会被压缩,但懂业务、懂建模、懂Agent的高级测试人员会更值钱。

回到老板的问题:“一套Skills库干掉30%手工测试,我们什么时候能?”

答案不是买某个工具,是开始封装第一个Skill。从你最烦的那个手工操作开始。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅