2026年6月11日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

一周 3.3k Star:微软 SkillOpt 开源,Agent Skill技能也能训练了,简直太香了(文末附领取方式)_tag2

发布日期:2026-06-05 21:11:04 浏览次数: 1528
作者:AItest进阶之路

微信搜一搜,关注“AItest进阶之路”

推荐语

微软SkillOpt开源,将Agent技能文档作为可训练参数,解决传统技能优化难题,性能提升显著。

核心内容:
1. SkillOpt的核心原理与独特价值
2. 传统技能优化方法的三大痛点
3. 实际应用案例与上手建议

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

微软联合国内几所高校,把 SkillOpt 开源了——上线一周,GitHub 3.3k Star;论文、代码、项目页,全套公开。

我第一反应是:等等,Skill 也能「训练」?

它干的事,其实就一件:不改模型权重,不加长 prompt,不靠人肉一条条改 skill.md;把技能文档当成外置参数,用任务轨迹和验证分数离线练出 best_skill.md,上线没有额外推理开销。

我顺着论文和仓库扒了一轮,本机还 pip install skillopt 跑了个 mini demo。下面按我自己的理解讲——先说你为什么需要它,再说它怎么练,最后说你从哪下手。


一、三条老路走不通,第四条刚开源

你想让 Agent 在某类任务上更稳,常见就三条路。

第一,微调模型。闭源碰不了权重;开源要数据、要算力,中小企业跟不起。

第二,人工写 Skill。吃工程师经验,人换人质量就飘;业务一变,文档得从头改。

第三,让 LLM 一次性生成 Skill。能盖常规场景,边缘 case 一碰就翻;没有闭环,错了也不会自己修。

我早些年还试过「自修正」——让 Agent 自己改 prompt,迭代几轮规则就开始跑偏,越改越离业务目标远,最后还不如第一版。

什么意思?

Skill 难的不在「写不出来」,而在「写完了怎么知道改对了、改错了怎么回滚、谁能持续改」。整条链缺一个可验证的闭环。

SkillOpt 给的是第四条路:不动目标模型一行代码,把 Skill 文档当成可训练参数,把深度学习那套前向、反向、更新、验证,平移到文本空间里。

不是给厨房换厨师,是把菜谱练到厨师闭着眼也能做对。


二、我自己的翻车现场——html-ppt 220 行,Agent 照样跳步骤

上周我准备技术分享,对着 html-ppt 的 SKILL 看了半天。规则写得很清楚:动手前必须先确认内容/受众/主题;提到「演讲、分享、逐字稿」必须走 presenter-mode-reveal 模板;每页 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询