我要投稿

腾讯AI三年，代码AI率从23%干到90%，最大的坑不是技术

发布日期：2026-06-08 19:00:16 浏览次数： 1518

作者：CSDN

微信搜一搜，关注“CSDN”

作者 | 唐小引

出品 | CSDN（ID：CSDNnews）

个人提效≠组织提效。

在腾讯云 AI 产业应用大会的主论坛上，腾讯云副总裁、CodeBuddy&WorkBuddy 负责人刘毅站在台上，用一句话给这两年的企业 AI 热潮泼了一盆冷水：「企业想要的，从来不是更聪明的个人工具，而是组织生产力。」

这句话不是在否定个人提效的价值，而是在点出一个更深的困境——过去一两年，几乎所有 AI 工具都在做同一件事：把个人变得更强。一批超级个体在企业里涌现，但组织整体的产出速度，并没有同步提升。

「大量超级个体，不代表是超级团队。」

这是刘毅反复强调的判断，也是腾讯云这次大会想回答的一个核心问题。

爆发元年，三个信号同时亮了

刘毅在演讲中给出了一个判断：2026 年是企业 Agent 真正的爆发元年。支撑这个判断的，是三件事在同一时间窗口里同时成熟。

模型成本一年降了 80%，Agent 跑得起来了。企业已经在验证 Agent 可以脱管、可以进生产。用户侧的习惯也已形成，大家开始自然而然地让 AI 代替自己完成工作。

「三件事同时发生，这才叫爆发元年，不是哪一项单独到位。」

这个判断背后有腾讯自己的数据支撑。WorkBuddy 火速风靡，发布以来是国内桌面端大模型产品第一，短短三个月内人均 Token 消耗量增长十倍，留存健康，用户规模飞速增长。高价值场景集中在金融、文档办公、教育、法律。模型调用量最多的是混元，Hy3 preview 发布后表现很好；DeepSeek 增长非常快，「效果直达、成本控制力强」；GLM、Kimi、MiniMax 等国产模型各有拥趸。

但刘毅认为，这些还只是「超级个体」阶段的数据。真正的组织级爆发，刚刚开始。

三层能力：从「会用 AI 的人」到「会用 AI 的组织」

WorkBuddy 这次给出的解法，是三层进阶能力：专家、助理、团队。每一层解决的问题不同，三层叠加，才构成从个人到组织的完整路径。

第一层：专家

以往用 AI 时，每次都要重新向它解释你是谁、背景是什么、用什么工具、输出什么格式，既繁琐，又无法复用。WorkBuddy 的「专家」把这套东西结构化了，用刘毅的话说，是「把岗位说明书写进了 AI 产品里」。

专家背后有四大基石：Skill 教它怎么做，MCP 教它去哪里做，连接器让它懂得该领域的知识和数据，Pipeline 是运行底座。对个人来说，这大幅降低了使用门槛；对企业来说，一个配置好的专家可以分享给整个团队，变成可复用、可传承的标准工作流入口。

一家知名游戏公司的案例被刘毅在台上提到：他们在 WorkBuddy 里安装了游戏引擎专家、策划专家、全栈工程师专家、内容创作专家，覆盖从策划到生产到营销的全流程，调用引擎专家完成 Unreal 代码生产，通过内容创作专家生成分镜视频和营销素材。「这样的案例，现在在每个行业都在发生。」

第二层：助理

专家的问题是「一次性调用」，用完就停了。助理解决的是这个问题：把专家从本地搬到云端，变成 7×24 小时长驻的数字员工。

助理多端可访问，有持久记忆，会记住你的习惯和要求，会把有效的流程自动生成标准化 Skill 存在云端专属的技能库里。刘毅描述的理想状态是：「你唤起一支助理团队，帮我准备明天客户的拜访，销售、法务、数据、文案四个专家同时开工，异步运行，最后汇总交付。」

「助理是越用越懂你的，这是一个会学习、会进化的数字员工，不是工具。」

第三层：团队

这是三层里最难，也是刘毅花笔墨最多的一层。

单个超级个体不会自动成为超级团队，原因在于三个结构性问题：人类组织和 AI 组织之间没有共同的协作空间；上下游之间不共享、不透明、无法持续沉淀；企业资产无法在人和 AI 之间自由流转。

WorkBuddy 的团队功能，是把人和助理装进同一个项目空间，共享上下文，让一个超级个体积累的技能和产物，沉淀为整个团队可以复用的 AI 资产。

「一人产出，全盘受益。启动、协作、交付、复用，每转一圈，组织的 AI 资产就厚一层。」

这次大会同步发布 WorkBuddy Enterprise 企业版，将三层能力打包交付，支持 Agent 运行观测、效果评估、AI 资产管理、成本管理和权限安全审计，支持 SaaS、VPC 独占和私有化部署三种形态。

腾讯内部的三年实验

讲组织转型，腾讯自己就是一个已经跑了三年的样本。

2022 年，腾讯开始在内部推行 AI Coding 服务。刘毅说，当时的代码接受率只有 23%。三年之后，到 2025 年底，腾讯大部分研发团队超过 90%的代码由 AI 生成，程序员开始并行开启多个任务，流水线全面提速。

从 23%到 90%，这条路并不平坦。

CSDN 向刘毅到了一个具体的问题：腾讯自己是怎么走完这条路的，经历了哪些阶段？

刘毅梳理了四步路径。第一步，培养超级个体，让优秀员工大量用 AI，在实战中跑出一批效率标杆。第二步，把这些超级个体摸索出来的经验，沉淀为 Skill、专家、AI 助理，让它们可以被复用而不是困在某个人的电脑里。第三步，把这些超级专家和助理融入真实的生产流程——不只是研发，财务、行政、招聘、法务这些岗位都是落地场景。第四步，企业管理部门介入做 AI 治理，统一管理成本、安全、权限和风险。

「这四步缺一不可，跳过任何一步，转型都会卡住。」

刘毅坦承踩过的坑：Token 成本是第一关，一开始放开用，账单下来会让人警觉，需要精细化的成本治理才能持续。AI 幻觉是第二关，Agent 跑出来的结果看起来没问题，但细节里藏着错误，直接进了生产就会出事，真实案例有过。「2026 年整个行业在强调 harness，就是给 AI 更多约束、更快速的校验迭代机制，这是从教训里总结出来的。」

但他说，这些技术层面的坑，都不是最难的。

最难的坎，是人性

这是整场采访里最令人印象深刻的一段话。

「员工不愿意把自己摸索出来的经验分享给同事。这不是坏人，是人性。你辛辛苦苦搭出来的一套 AI 工作流，凭什么白送给团队？」

腾讯内部推动这件事，靠的不是喊口号，是搭机制：技能大赛、专家大赛，把通道晋升和 AI 影响力挂钩，让一个人的 AI 能力可以影响多少同事、可以为组织沉淀多少资产，变成晋升通道上的激励因子。

「这样才推得动。」

这段话之所以值得关注，是因为它指出了大多数企业在做 AI 转型时会踩的隐形陷阱——不是没有技术，不是没有工具，而是没有解决人愿不愿意让组织从自己身上「学习」这个根本问题。

AI 原生组织的样子

腾讯自己的 AI 原生团队，已经形成了一套具体的运转方式。

组织结构极度扁平，只有组，没有其他层级。所有上下文透明共享——代码、需求、用户反馈、工单、设计，全员可见。「AI 在透明充分的信息环境里工作，不会因为信息隔阂而低效，那些原本因信息壁垒而存在的管理层级，很多就没有存在的必要了。」

代码安全方面，刘毅提到三个硬约束：

资深专家负责架构，AI 不能大量改动架构，架构变动触发告警；
引入 AI 做代码评审，但生产代码的 AI 和评审代码的 AI 必须是不同的，「不能让同一个 AI 自己检查自己」；
质量左移，用 AI 大量生产自动化测试代码，在 CI/CT 阶段拦截风险，不让问题进入生产环境。

对于没有代码背景的业务人员，刘毅的判断是：小特性、低风险的改善型功能，产品经理完全可以独立完成并灰度上线；核心模块或大型特性，需要把设计师、架构师拉进同一个 session 协作——「把整个过程透明化，这就是 AI 团队的协作方式。」

衡量转型健康度的两个指标

怎么知道一家企业的 AI 转型是否真正有效？刘毅给出了两个他认为比「效率提升 X 倍」更有参考价值的指标。

需求吞吐率，指一个组织在单位时间里能响应多少需求、把多少新想法落地上线。这是创新速度和市场响应能力的真实度量，可以横向比较不同团队，也可以纵向追踪同一团队的变化曲线。
AI 平滑度，指端到端完成一个任务的顺畅程度——具体表现在过程中有多少卡点，需要多少次系统权限申请、人工审批介入。卡点越少，AI 平滑度越高。这个指标背后，依赖 MCP 打通越来越多的系统和数据。

「这两个指标是动态的，可以持续追踪，比一次性的效率报告更能反映真实状态。」

「产品功能层面，2025 年中以后没什么差距了」

国内 AI Coding 工具与 Claude Code 之间的差距，是这个领域绕不开的问题。

刘毅的回答分两层：模型层面，中国与硅谷确实有一定差距，算力还在追赶中，这一点不回避。但产品功能层面，「2025 年中以后已经没有什么差距了。CodeBuddy 整个 harness 工程，用 SWE-bench 类的测试评测，得分不低于 Claude Code。」

他强调，跑分是参考，不是终点。「只要把用户场景和业务流程链接好，能真实解决企业问题，这才是关键。」

WorkBuddy 能在竞争激烈的市场里跑出来，刘毅认为有三个原因：站在了大模型最擅长的代码方向，起点选对了；两年多时间打磨出了 Coding Agent 为基石的 Agent OS，使得 WorkBuddy 一诞生就有成熟的 harness core；腾讯的产品基因强调用户体验，「追求那种心流状态，让用户用起来流畅不割裂」，这带来了好的留存和复购。

竞争的制高点，他认为是生态。「在好的用户体验和用户基础上，连接行业数据 know-how 和人类专家，形成有商业回报的生态系统。这是通用智能体平台未来竞争真正的制高点。」

商业化的逻辑：把决策权还给用户

尽管汤道生直言并没有给 Buddy 团队设商业化目标，但 Buddy 团队有着自己的努力与思考。

张翔负责 WorkBuddy 的商业化，他谈到了一个具体的定价设计。

面对企业拿「每百万 Token 多少钱」来横向比较云厂商的做法，WorkBuddy 没有直接对标。腾讯用统一的 credit 货币体系打通多个 SaaS 应用，用系数区分不同模型的价格，「让用户清楚知道每一笔消耗对应的是什么」。

不同任务的复杂度差异巨大，难以做平均成本对比。一个即将上线的功能回答了这个问题：提交任务前，系统会预估这次执行会消耗多少 credit，让用户自主决定值不值得跑。

「这个决策权应该在用户手里。」

合作伙伴生态上，张翔提到三类：分销渠道；基于平台基建、结合垂直数据优势打造行业 Agent 的内容创作伙伴；以及终端 IoT 硬件伙伴。

「人的价值在于责任」

员工把个人经验贡献给企业 AI 资产，会不会加速自己被替代？这是身为员工的我们，在拥抱 AI 时最担心的问题。

张翔的回答落在了一个更底层的逻辑上：「人在 AI 时代的核心价值在于责任。人始终是流程的责任主体，负责 review AI 的产出，确保它符合企业的要求。AI 生产内容，但谁来为这个内容负责，是人。这个边界不会消失。」

刘毅从考核角度补充：腾讯对员工的考核标准没有因为 AI 而改变，还是岗位职责下的产出和担责。判断一个人用 AI 用得好不好，看的是最终产出里他担了哪些责、添了哪些判断、发布了哪些产品上线。「量化 AI 贡献这件事，从来不是数 token 数，而是看这个人最终的影响力和产出。」

WorkBuddy 定位更长远的问题，刘毅也在采访中触及。用户用习惯了一个 AI 作为工作入口后，下班后也会继续用——获取资讯、处理生活事务。「AI 成为每个人的助理之后，用户不想在不同场景下切换不同 AI。」WorkBuddy 的方向，是作为统一的 AI 入口，通过生态建设来满足用户多样化的需求。

「生态多样性，有利于产品和商业的共同繁荣。」

2026 年下半年，「企业级会出现快速增长、快速爆发、快速落地的阶段」，在采访中，刘毅如是说道，不是预测，而是他观察到的客户状态。

从超级个体到超级团队，腾讯云这套打法，是否能够真正解决企业 AI 落地的真实困境？我们拭目以待。

【END】