微信扫码
添加专属顾问
我要投稿
腾讯AI三年实现代码AI率从23%到90%,但最大的挑战并非技术,而是如何将个人效率转化为真正的组织生产力。核心内容: 1. 企业AI应用的核心困境:个人提效与组织提效的差距 2. 2026年成为企业Agent爆发元年的三大信号 3. WorkBuddy提供的三层进阶能力:专家、助理、团队
个人提效≠组织提效。
在腾讯云 AI 产业应用大会的主论坛上,腾讯云副总裁、CodeBuddy&WorkBuddy 负责人刘毅站在台上,用一句话给这两年的企业 AI 热潮泼了一盆冷水:「企业想要的,从来不是更聪明的个人工具,而是组织生产力。」
这句话不是在否定个人提效的价值,而是在点出一个更深的困境——过去一两年,几乎所有 AI 工具都在做同一件事:把个人变得更强。一批超级个体在企业里涌现,但组织整体的产出速度,并没有同步提升。
「大量超级个体,不代表是超级团队。」
这是刘毅反复强调的判断,也是腾讯云这次大会想回答的一个核心问题。
爆发元年,三个信号同时亮了
刘毅在演讲中给出了一个判断:2026 年是企业 Agent 真正的爆发元年。支撑这个判断的,是三件事在同一时间窗口里同时成熟。
模型成本一年降了 80%,Agent 跑得起来了。企业已经在验证 Agent 可以脱管、可以进生产。用户侧的习惯也已形成,大家开始自然而然地让 AI 代替自己完成工作。
「三件事同时发生,这才叫爆发元年,不是哪一项单独到位。」
这个判断背后有腾讯自己的数据支撑。WorkBuddy 火速风靡,发布以来是国内桌面端大模型产品第一,短短三个月内人均 Token 消耗量增长十倍,留存健康,用户规模飞速增长。高价值场景集中在金融、文档办公、教育、法律。模型调用量最多的是混元,Hy3 preview 发布后表现很好;DeepSeek 增长非常快,「效果直达、成本控制力强」;GLM、Kimi、MiniMax 等国产模型各有拥趸。
但刘毅认为,这些还只是「超级个体」阶段的数据。真正的组织级爆发,刚刚开始。
三层能力:从「会用 AI 的人」到「会用 AI 的组织」
WorkBuddy 这次给出的解法,是三层进阶能力:专家、助理、团队。每一层解决的问题不同,三层叠加,才构成从个人到组织的完整路径。
第一层:专家
以往用 AI 时,每次都要重新向它解释你是谁、背景是什么、用什么工具、输出什么格式,既繁琐,又无法复用。WorkBuddy 的「专家」把这套东西结构化了,用刘毅的话说,是「把岗位说明书写进了 AI 产品里」。
专家背后有四大基石:Skill 教它怎么做,MCP 教它去哪里做,连接器让它懂得该领域的知识和数据,Pipeline 是运行底座。对个人来说,这大幅降低了使用门槛;对企业来说,一个配置好的专家可以分享给整个团队,变成可复用、可传承的标准工作流入口。
一家知名游戏公司的案例被刘毅在台上提到:他们在 WorkBuddy 里安装了游戏引擎专家、策划专家、全栈工程师专家、内容创作专家,覆盖从策划到生产到营销的全流程,调用引擎专家完成 Unreal 代码生产,通过内容创作专家生成分镜视频和营销素材。「这样的案例,现在在每个行业都在发生。」
第二层:助理
专家的问题是「一次性调用」,用完就停了。助理解决的是这个问题:把专家从本地搬到云端,变成 7×24 小时长驻的数字员工。
助理多端可访问,有持久记忆,会记住你的习惯和要求,会把有效的流程自动生成标准化 Skill 存在云端专属的技能库里。刘毅描述的理想状态是:「你唤起一支助理团队,帮我准备明天客户的拜访,销售、法务、数据、文案四个专家同时开工,异步运行,最后汇总交付。」
「助理是越用越懂你的,这是一个会学习、会进化的数字员工,不是工具。」
第三层:团队
这是三层里最难,也是刘毅花笔墨最多的一层。
单个超级个体不会自动成为超级团队,原因在于三个结构性问题:人类组织和 AI 组织之间没有共同的协作空间;上下游之间不共享、不透明、无法持续沉淀;企业资产无法在人和 AI 之间自由流转。
WorkBuddy 的团队功能,是把人和助理装进同一个项目空间,共享上下文,让一个超级个体积累的技能和产物,沉淀为整个团队可以复用的 AI 资产。
「一人产出,全盘受益。启动、协作、交付、复用,每转一圈,组织的 AI 资产就厚一层。」
这次大会同步发布 WorkBuddy Enterprise 企业版,将三层能力打包交付,支持 Agent 运行观测、效果评估、AI 资产管理、成本管理和权限安全审计,支持 SaaS、VPC 独占和私有化部署三种形态。
腾讯内部的三年实验
讲组织转型,腾讯自己就是一个已经跑了三年的样本。
2022 年,腾讯开始在内部推行 AI Coding 服务。刘毅说,当时的代码接受率只有 23%。三年之后,到 2025 年底,腾讯大部分研发团队超过 90%的代码由 AI 生成,程序员开始并行开启多个任务,流水线全面提速。
从 23%到 90%,这条路并不平坦。
CSDN 向刘毅到了一个具体的问题:腾讯自己是怎么走完这条路的,经历了哪些阶段?
刘毅梳理了四步路径。第一步,培养超级个体,让优秀员工大量用 AI,在实战中跑出一批效率标杆。第二步,把这些超级个体摸索出来的经验,沉淀为 Skill、专家、AI 助理,让它们可以被复用而不是困在某个人的电脑里。第三步,把这些超级专家和助理融入真实的生产流程——不只是研发,财务、行政、招聘、法务这些岗位都是落地场景。第四步,企业管理部门介入做 AI 治理,统一管理成本、安全、权限和风险。
「这四步缺一不可,跳过任何一步,转型都会卡住。」
刘毅坦承踩过的坑:Token 成本是第一关,一开始放开用,账单下来会让人警觉,需要精细化的成本治理才能持续。AI 幻觉是第二关,Agent 跑出来的结果看起来没问题,但细节里藏着错误,直接进了生产就会出事,真实案例有过。「2026 年整个行业在强调 harness,就是给 AI 更多约束、更快速的校验迭代机制,这是从教训里总结出来的。」
但他说,这些技术层面的坑,都不是最难的。
最难的坎,是人性
这是整场采访里最令人印象深刻的一段话。
「员工不愿意把自己摸索出来的经验分享给同事。这不是坏人,是人性。你辛辛苦苦搭出来的一套 AI 工作流,凭什么白送给团队?」
腾讯内部推动这件事,靠的不是喊口号,是搭机制:技能大赛、专家大赛,把通道晋升和 AI 影响力挂钩,让一个人的 AI 能力可以影响多少同事、可以为组织沉淀多少资产,变成晋升通道上的激励因子。
「这样才推得动。」
这段话之所以值得关注,是因为它指出了大多数企业在做 AI 转型时会踩的隐形陷阱——不是没有技术,不是没有工具,而是没有解决人愿不愿意让组织从自己身上「学习」这个根本问题。
AI 原生组织的样子
腾讯自己的 AI 原生团队,已经形成了一套具体的运转方式。
组织结构极度扁平,只有组,没有其他层级。所有上下文透明共享——代码、需求、用户反馈、工单、设计,全员可见。「AI 在透明充分的信息环境里工作,不会因为信息隔阂而低效,那些原本因信息壁垒而存在的管理层级,很多就没有存在的必要了。」
代码安全方面,刘毅提到三个硬约束:
资深专家负责架构,AI 不能大量改动架构,架构变动触发告警;
引入 AI 做代码评审,但生产代码的 AI 和评审代码的 AI 必须是不同的,「不能让同一个 AI 自己检查自己」;
质量左移,用 AI 大量生产自动化测试代码,在 CI/CT 阶段拦截风险,不让问题进入生产环境。
对于没有代码背景的业务人员,刘毅的判断是:小特性、低风险的改善型功能,产品经理完全可以独立完成并灰度上线;核心模块或大型特性,需要把设计师、架构师拉进同一个 session 协作——「把整个过程透明化,这就是 AI 团队的协作方式。」
衡量转型健康度的两个指标
怎么知道一家企业的 AI 转型是否真正有效?刘毅给出了两个他认为比「效率提升 X 倍」更有参考价值的指标。
需求吞吐率,指一个组织在单位时间里能响应多少需求、把多少新想法落地上线。这是创新速度和市场响应能力的真实度量,可以横向比较不同团队,也可以纵向追踪同一团队的变化曲线。
AI 平滑度,指端到端完成一个任务的顺畅程度——具体表现在过程中有多少卡点,需要多少次系统权限申请、人工审批介入。卡点越少,AI 平滑度越高。这个指标背后,依赖 MCP 打通越来越多的系统和数据。
「这两个指标是动态的,可以持续追踪,比一次性的效率报告更能反映真实状态。」
「产品功能层面,2025 年中以后没什么差距了」
国内 AI Coding 工具与 Claude Code 之间的差距,是这个领域绕不开的问题。
刘毅的回答分两层:模型层面,中国与硅谷确实有一定差距,算力还在追赶中,这一点不回避。但产品功能层面,「2025 年中以后已经没有什么差距了。CodeBuddy 整个 harness 工程,用 SWE-bench 类的测试评测,得分不低于 Claude Code。」
他强调,跑分是参考,不是终点。「只要把用户场景和业务流程链接好,能真实解决企业问题,这才是关键。」
WorkBuddy 能在竞争激烈的市场里跑出来,刘毅认为有三个原因:站在了大模型最擅长的代码方向,起点选对了;两年多时间打磨出了 Coding Agent 为基石的 Agent OS,使得 WorkBuddy 一诞生就有成熟的 harness core;腾讯的产品基因强调用户体验,「追求那种心流状态,让用户用起来流畅不割裂」,这带来了好的留存和复购。
竞争的制高点,他认为是生态。「在好的用户体验和用户基础上,连接行业数据 know-how 和人类专家,形成有商业回报的生态系统。这是通用智能体平台未来竞争真正的制高点。」
商业化的逻辑:把决策权还给用户
尽管汤道生直言并没有给 Buddy 团队设商业化目标,但 Buddy 团队有着自己的努力与思考。
张翔负责 WorkBuddy 的商业化,他谈到了一个具体的定价设计。
面对企业拿「每百万 Token 多少钱」来横向比较云厂商的做法,WorkBuddy 没有直接对标。腾讯用统一的 credit 货币体系打通多个 SaaS 应用,用系数区分不同模型的价格,「让用户清楚知道每一笔消耗对应的是什么」。
不同任务的复杂度差异巨大,难以做平均成本对比。一个即将上线的功能回答了这个问题:提交任务前,系统会预估这次执行会消耗多少 credit,让用户自主决定值不值得跑。
「这个决策权应该在用户手里。」
合作伙伴生态上,张翔提到三类:分销渠道;基于平台基建、结合垂直数据优势打造行业 Agent 的内容创作伙伴;以及终端 IoT 硬件伙伴。
「人的价值在于责任」
员工把个人经验贡献给企业 AI 资产,会不会加速自己被替代?这是身为员工的我们,在拥抱 AI 时最担心的问题。
张翔的回答落在了一个更底层的逻辑上:「人在 AI 时代的核心价值在于责任。人始终是流程的责任主体,负责 review AI 的产出,确保它符合企业的要求。AI 生产内容,但谁来为这个内容负责,是人。这个边界不会消失。」
刘毅从考核角度补充:腾讯对员工的考核标准没有因为 AI 而改变,还是岗位职责下的产出和担责。判断一个人用 AI 用得好不好,看的是最终产出里他担了哪些责、添了哪些判断、发布了哪些产品上线。「量化 AI 贡献这件事,从来不是数 token 数,而是看这个人最终的影响力和产出。」
WorkBuddy 定位更长远的问题,刘毅也在采访中触及。用户用习惯了一个 AI 作为工作入口后,下班后也会继续用——获取资讯、处理生活事务。「AI 成为每个人的助理之后,用户不想在不同场景下切换不同 AI。」WorkBuddy 的方向,是作为统一的 AI 入口,通过生态建设来满足用户多样化的需求。
「生态多样性,有利于产品和商业的共同繁荣。」
2026 年下半年,「企业级会出现快速增长、快速爆发、快速落地的阶段」,在采访中,刘毅如是说道,不是预测,而是他观察到的客户状态。
从超级个体到超级团队,腾讯云这套打法,是否能够真正解决企业 AI 落地的真实困境?我们拭目以待。
【END】
推荐阅读:
领取地址:https://s.csdn.cn/4nPsOp
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-08
Anthropic终于公开了他们内部Skill方法论。
2026-06-08
Kimi Work 来了!10 分钟用它做一个投资大师 Skill,开源了。
2026-06-08
为什么各大公司开始大张旗鼓搞Skill中台?
2026-06-07
重磅!Anthropic内部Skills经验公开了!
2026-06-04
一篇文章讲清楚 AI Agent:从 Token、RAG、Skill 到 MCP、SDD 和 Harness 工程
2026-06-03
客户投诉分析 Skill:把散落的抱怨,变成可执行的改进清单
2026-06-03
从零搭建 Harness Engineering 架构:Rule、Skill、Sub-Agent 完整落地路径
2026-06-03
清华发布的Legal Skills和Claude for Legal有什么编排差别
2026-04-05
2026-03-17
2026-05-15
2026-03-26
2026-03-17
2026-04-09
2026-03-18
2026-03-16
2026-03-18
2026-04-14