2026年6月11日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

腾讯AI三年,代码AI率从23%干到90%,最大的坑不是技术

发布日期:2026-06-08 19:00:16 浏览次数: 1518
作者:CSDN

微信搜一搜,关注“CSDN”

推荐语

腾讯AI三年实现代码AI率从23%到90%,但最大的挑战并非技术,而是如何将个人效率转化为真正的组织生产力。

核心内容:
1. 企业AI应用的核心困境:个人提效与组织提效的差距
2. 2026年成为企业Agent爆发元年的三大信号
3. WorkBuddy提供的三层进阶能力:专家、助理、团队

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

作者 | 唐小引
出品 | CSDN(ID:CSDNnews)

个人提效≠组织提效。

在腾讯云 AI 产业应用大会的主论坛上,腾讯云副总裁、CodeBuddy&WorkBuddy 负责人刘毅站在台上,用一句话给这两年的企业 AI 热潮泼了一盆冷水:「企业想要的,从来不是更聪明的个人工具,而是组织生产力。」

这句话不是在否定个人提效的价值,而是在点出一个更深的困境——过去一两年,几乎所有 AI 工具都在做同一件事:把个人变得更强。一批超级个体在企业里涌现,但组织整体的产出速度,并没有同步提升。

「大量超级个体,不代表是超级团队。」

这是刘毅反复强调的判断,也是腾讯云这次大会想回答的一个核心问题。


爆发元年,三个信号同时亮了

刘毅在演讲中给出了一个判断:2026 年是企业 Agent 真正的爆发元年。支撑这个判断的,是三件事在同一时间窗口里同时成熟。

模型成本一年降了 80%,Agent 跑得起来了。企业已经在验证 Agent 可以脱管、可以进生产。用户侧的习惯也已形成,大家开始自然而然地让 AI 代替自己完成工作。

「三件事同时发生,这才叫爆发元年,不是哪一项单独到位。」

这个判断背后有腾讯自己的数据支撑。WorkBuddy 火速风靡,发布以来是国内桌面端大模型产品第一,短短三个月内人均 Token 消耗量增长十倍,留存健康,用户规模飞速增长。高价值场景集中在金融、文档办公、教育、法律。模型调用量最多的是混元,Hy3 preview 发布后表现很好;DeepSeek 增长非常快,「效果直达、成本控制力强」;GLM、Kimi、MiniMax 等国产模型各有拥趸。

但刘毅认为,这些还只是「超级个体」阶段的数据。真正的组织级爆发,刚刚开始。


三层能力:从「会用 AI 的人」到「会用 AI 的组织」

WorkBuddy 这次给出的解法,是三层进阶能力:专家、助理、团队。每一层解决的问题不同,三层叠加,才构成从个人到组织的完整路径。

  • 第一层:专家

以往用 AI 时,每次都要重新向它解释你是谁、背景是什么、用什么工具、输出什么格式,既繁琐,又无法复用。WorkBuddy 的「专家」把这套东西结构化了,用刘毅的话说,是「把岗位说明书写进了 AI 产品里」。

专家背后有四大基石:Skill 教它怎么做,MCP 教它去哪里做,连接器让它懂得该领域的知识和数据,Pipeline 是运行底座。对个人来说,这大幅降低了使用门槛;对企业来说,一个配置好的专家可以分享给整个团队,变成可复用、可传承的标准工作流入口。

一家知名游戏公司的案例被刘毅在台上提到:他们在 WorkBuddy 里安装了游戏引擎专家、策划专家、全栈工程师专家、内容创作专家,覆盖从策划到生产到营销的全流程,调用引擎专家完成 Unreal 代码生产,通过内容创作专家生成分镜视频和营销素材。「这样的案例,现在在每个行业都在发生。」

第二层:助理

专家的问题是「一次性调用」,用完就停了。助理解决的是这个问题:把专家从本地搬到云端,变成 7×24 小时长驻的数字员工。

助理多端可访问,有持久记忆,会记住你的习惯和要求,会把有效的流程自动生成标准化 Skill 存在云端专属的技能库里。刘毅描述的理想状态是:「你唤起一支助理团队,帮我准备明天客户的拜访,销售、法务、数据、文案四个专家同时开工,异步运行,最后汇总交付。」

「助理是越用越懂你的,这是一个会学习、会进化的数字员工,不是工具。」

第三层:团队

这是三层里最难,也是刘毅花笔墨最多的一层。

单个超级个体不会自动成为超级团队,原因在于三个结构性问题:人类组织和 AI 组织之间没有共同的协作空间;上下游之间不共享、不透明、无法持续沉淀;企业资产无法在人和 AI 之间自由流转。

WorkBuddy 的团队功能,是把人和助理装进同一个项目空间,共享上下文,让一个超级个体积累的技能和产物,沉淀为整个团队可以复用的 AI 资产。

「一人产出,全盘受益。启动、协作、交付、复用,每转一圈,组织的 AI 资产就厚一层。」

这次大会同步发布 WorkBuddy Enterprise 企业版,将三层能力打包交付,支持 Agent 运行观测、效果评估、AI 资产管理、成本管理和权限安全审计,支持 SaaS、VPC 独占和私有化部署三种形态。


腾讯内部的三年实验

讲组织转型,腾讯自己就是一个已经跑了三年的样本。

2022 年,腾讯开始在内部推行 AI Coding 服务。刘毅说,当时的代码接受率只有 23%。三年之后,到 2025 年底,腾讯大部分研发团队超过 90%的代码由 AI 生成,程序员开始并行开启多个任务,流水线全面提速。

从 23%到 90%,这条路并不平坦。

CSDN 向刘毅到了一个具体的问题:腾讯自己是怎么走完这条路的,经历了哪些阶段?

刘毅梳理了四步路径。第一步,培养超级个体,让优秀员工大量用 AI,在实战中跑出一批效率标杆。第二步,把这些超级个体摸索出来的经验,沉淀为 Skill、专家、AI 助理,让它们可以被复用而不是困在某个人的电脑里。第三步,把这些超级专家和助理融入真实的生产流程——不只是研发,财务、行政、招聘、法务这些岗位都是落地场景。第四步,企业管理部门介入做 AI 治理,统一管理成本、安全、权限和风险。

「这四步缺一不可,跳过任何一步,转型都会卡住。」

刘毅坦承踩过的坑:Token 成本是第一关,一开始放开用,账单下来会让人警觉,需要精细化的成本治理才能持续。AI 幻觉是第二关,Agent 跑出来的结果看起来没问题,但细节里藏着错误,直接进了生产就会出事,真实案例有过。「2026 年整个行业在强调 harness,就是给 AI 更多约束、更快速的校验迭代机制,这是从教训里总结出来的。」

但他说,这些技术层面的坑,都不是最难的。


最难的坎,是人性

这是整场采访里最令人印象深刻的一段话。

「员工不愿意把自己摸索出来的经验分享给同事。这不是坏人,是人性。你辛辛苦苦搭出来的一套 AI 工作流,凭什么白送给团队?」

腾讯内部推动这件事,靠的不是喊口号,是搭机制:技能大赛、专家大赛,把通道晋升和 AI 影响力挂钩,让一个人的 AI 能力可以影响多少同事、可以为组织沉淀多少资产,变成晋升通道上的激励因子。

「这样才推得动。」

这段话之所以值得关注,是因为它指出了大多数企业在做 AI 转型时会踩的隐形陷阱——不是没有技术,不是没有工具,而是没有解决人愿不愿意让组织从自己身上「学习」这个根本问题。


AI 原生组织的样子

腾讯自己的 AI 原生团队,已经形成了一套具体的运转方式。

组织结构极度扁平,只有组,没有其他层级。所有上下文透明共享——代码、需求、用户反馈、工单、设计,全员可见。「AI 在透明充分的信息环境里工作,不会因为信息隔阂而低效,那些原本因信息壁垒而存在的管理层级,很多就没有存在的必要了。」

代码安全方面,刘毅提到三个硬约束:

  • 资深专家负责架构,AI 不能大量改动架构,架构变动触发告警;

  • 引入 AI 做代码评审,但生产代码的 AI 和评审代码的 AI 必须是不同的,「不能让同一个 AI 自己检查自己」;

  • 质量左移,用 AI 大量生产自动化测试代码,在 CI/CT 阶段拦截风险,不让问题进入生产环境。

对于没有代码背景的业务人员,刘毅的判断是:小特性、低风险的改善型功能,产品经理完全可以独立完成并灰度上线;核心模块或大型特性,需要把设计师、架构师拉进同一个 session 协作——「把整个过程透明化,这就是 AI 团队的协作方式。」


衡量转型健康度的两个指标

怎么知道一家企业的 AI 转型是否真正有效?刘毅给出了两个他认为比「效率提升 X 倍」更有参考价值的指标。

  • 需求吞吐率,指一个组织在单位时间里能响应多少需求、把多少新想法落地上线。这是创新速度和市场响应能力的真实度量,可以横向比较不同团队,也可以纵向追踪同一团队的变化曲线。

  • AI 平滑度,指端到端完成一个任务的顺畅程度——具体表现在过程中有多少卡点,需要多少次系统权限申请、人工审批介入。卡点越少,AI 平滑度越高。这个指标背后,依赖 MCP 打通越来越多的系统和数据。

「这两个指标是动态的,可以持续追踪,比一次性的效率报告更能反映真实状态。」


「产品功能层面,2025 年中以后没什么差距了」

国内 AI Coding 工具与 Claude Code 之间的差距,是这个领域绕不开的问题。

刘毅的回答分两层:模型层面,中国与硅谷确实有一定差距,算力还在追赶中,这一点不回避。但产品功能层面,「2025 年中以后已经没有什么差距了。CodeBuddy 整个 harness 工程,用 SWE-bench 类的测试评测,得分不低于 Claude Code。」

他强调,跑分是参考,不是终点。「只要把用户场景和业务流程链接好,能真实解决企业问题,这才是关键。」

WorkBuddy 能在竞争激烈的市场里跑出来,刘毅认为有三个原因:站在了大模型最擅长的代码方向,起点选对了;两年多时间打磨出了 Coding Agent 为基石的 Agent OS,使得 WorkBuddy 一诞生就有成熟的 harness core;腾讯的产品基因强调用户体验,「追求那种心流状态,让用户用起来流畅不割裂」,这带来了好的留存和复购。

竞争的制高点,他认为是生态。「在好的用户体验和用户基础上,连接行业数据 know-how 和人类专家,形成有商业回报的生态系统。这是通用智能体平台未来竞争真正的制高点。」


商业化的逻辑:把决策权还给用户

尽管汤道生直言并没有给 Buddy 团队设商业化目标,但 Buddy 团队有着自己的努力与思考。

张翔负责 WorkBuddy 的商业化,他谈到了一个具体的定价设计。

面对企业拿「每百万 Token 多少钱」来横向比较云厂商的做法,WorkBuddy 没有直接对标。腾讯用统一的 credit 货币体系打通多个 SaaS 应用,用系数区分不同模型的价格,「让用户清楚知道每一笔消耗对应的是什么」。

不同任务的复杂度差异巨大,难以做平均成本对比。一个即将上线的功能回答了这个问题:提交任务前,系统会预估这次执行会消耗多少 credit,让用户自主决定值不值得跑。

「这个决策权应该在用户手里。」

合作伙伴生态上,张翔提到三类:分销渠道;基于平台基建、结合垂直数据优势打造行业 Agent 的内容创作伙伴;以及终端 IoT 硬件伙伴。


「人的价值在于责任」

员工把个人经验贡献给企业 AI 资产,会不会加速自己被替代?这是身为员工的我们,在拥抱 AI 时最担心的问题。

张翔的回答落在了一个更底层的逻辑上:「人在 AI 时代的核心价值在于责任。人始终是流程的责任主体,负责 review AI 的产出,确保它符合企业的要求。AI 生产内容,但谁来为这个内容负责,是人。这个边界不会消失。」

刘毅从考核角度补充:腾讯对员工的考核标准没有因为 AI 而改变,还是岗位职责下的产出和担责。判断一个人用 AI 用得好不好,看的是最终产出里他担了哪些责、添了哪些判断、发布了哪些产品上线。「量化 AI 贡献这件事,从来不是数 token 数,而是看这个人最终的影响力和产出。」

WorkBuddy 定位更长远的问题,刘毅也在采访中触及。用户用习惯了一个 AI 作为工作入口后,下班后也会继续用——获取资讯、处理生活事务。「AI 成为每个人的助理之后,用户不想在不同场景下切换不同 AI。」WorkBuddy 的方向,是作为统一的 AI 入口,通过生态建设来满足用户多样化的需求。

「生态多样性,有利于产品和商业的共同繁荣。」

2026 年下半年,「企业级会出现快速增长、快速爆发、快速落地的阶段」,在采访中,刘毅如是说道,不是预测,而是他观察到的客户状态。

从超级个体到超级团队,腾讯云这套打法,是否能够真正解决企业 AI 落地的真实困境?我们拭目以待。

【END】

推荐阅读:

字节跳动:没有造车或推出汽车品牌计划;谷歌每月9.2亿美元租SpaceX算力;ChatGPT将进行大升级 | 极客头条

对话汤道生:腾讯 AI 不是赛马,元宝与混元搬进同一栋楼

停止AI研发!Anthropic万字长文警告:AI“递归式自我改进”正在逼近

🎁 开发者“神装”补给站|CSDN 6 月宠粉福利
不论你是想跑通最新的本地 LLM,还是想实测一套 Agent 自动化工作流,算力与补给,我们都为你备齐了!
立领三重进阶大礼:
200 小时云端算力券免费领
瑞幸咖啡/肯德基早餐/下午茶任选其一
👇 扫码即刻领取,今日额度有限,手慢无!
图片


领取地址:https://s.csdn.cn/4nPsOp

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询