免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

腾讯大模型「变阵」:成立 AI Infra 部,姚顺雨出任首席 AI 科学家

发布日期:2025-12-17 19:47:43 浏览次数: 1529
作者:极客公园

微信搜一搜,关注“极客公园”

推荐语

腾讯大模型研发迎来重大变革,98年顶尖科学家姚顺雨领衔AI Infra部,加速混元2.0时代的技术突破。

核心内容:
1. 腾讯大模型研发体系架构调整,成立三个新部门
2. 姚顺雨出任首席AI科学家,推动组织变革与技术升级
3. 腾讯大模型战略转向研究派主导,强化前沿AI能力

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
在混元 2.0 发布两周后,腾讯大模型研发体系完成了一次关键的「系统升级」。

作者|连冉

编辑|郑玄

大模型战事进入深水区,腾讯正在通过调整阵型,来适应更快的速度。

12 月 17 日,腾讯宣布升级大模型研发架构。这次调整最核心的变化在于成立了三个新部门:AI Infra 部、AI Data 部、数据计算平台部

这是腾讯在混元大模型步入 2.0 时代后,对研发体系的一次全面「提速」。

在人事任命上,技术派高管被推向了更核心的位置。Vincesyao 出任「CEO/总裁办公室」首席 AI 科学家,直接向腾讯总裁刘炽平汇报;同时,他还兼任新成立的 AI Infra 部及大语言模型部负责人,向技术工程事业群(TEG)总裁卢山汇报。

一手抓算法(大语言模型部),一手抓算力基建(AI Infra 部),同时直通公司最高决策层,这一配置表明:在腾讯的战略棋盘中,大模型的研究与工程落地正在完成深度耦合。


01

姚顺雨,98 年的 AI 顶尖青年科学家

据了解,Vinces Yao 就是数月前传闻入职腾讯的姚顺雨,毕业于清华和普林斯顿大学,曾任 OpenAI 研究员。

据外媒报道,自今年 9 月从 OpenAI 离职加入腾讯以来,姚顺雨被高层赋予了极大的权限,以推动内部的文化与组织变革。过去几个月里,腾讯一改往日在大模型人才战中的守势,开始以双倍薪资激进地从字节跳动等竞争对手处挖角核心研究员,并为应届博士生开出高出行业标准 50% 的薪资溢价。

姚顺雨 10 月在 X 上发帖|图片来源:X


更深层的变化在于「权力交接」。腾讯正在进行内部重组,降级那些虽擅长工程落地和广告算法、但缺乏前沿 AI 研究背景的管理者,将指挥棒真正交还给「研究派」。这种去肥增瘦的动作,旨在打破过去「产品经理思维」主导大模型研发的局限。

姚顺雨出生于 1998 年,是人工智能领域的顶尖青年科学家,本科毕业于清华大学计算机系(姚班),后赴普林斯顿大学攻读计算机科学博士学位,2024 年正式加入 OpenAI,专注于智能体(Agents)与深度研究(Deep Research)方向。

他在 OpenAI 任职及相关研究期间,主要在大模型推理、Agent(智能体)——及评估体系方面取得了核心成果:

提升推理能力:提出了著名的思维树(Tree of Thoughts, ToT),通过让大模型进行多路径推理和反复思考,大幅提升了模型解决复杂问题的能力;

智能体研究:他是 SWE-bench(大模型代码能力评估数据集)和 SWE-agent(开源 AI 智能体)的关键贡献者,并参与了 ReAct(推理与行动结合)和 CoALA(智能体认知架构)等开创性工作。

此外,他还在个人社交平台发布了关于「AI 下半场」的思考,主张 AI 发展的重心应从单纯的训练转向定义问题与评估,提出要像产品经理一样思考「解决什么问题」,认为在当前阶段评估比训练更为重要。


02

为什么是 AI Infra?

在过去一年的「百模大战」中,行业逐渐达成一个共识:大模型的竞争,早已超越了单纯的算法层面,变成了算力、数据、工程化能力的综合比拼。

此次腾讯成立 AI Infra 部,也是为了解决「算力效率」这一关键命题。

据官方信息,AI Infra 部将作为腾讯大模型体系的重要一环,聚焦于大模型分布式训练、高性能推理服务等核心技术。其目标非常明确:构建大模型 AI Infra 的核心竞争力,为算法研发和业务场景落地提供稳定、高效的技术底座。

这符合大模型技术演进的规律——当模型参数量级不断跃升(如腾讯近期发布的混元 2.0),如何让庞大的 GPU 集群高效运转,如何在大规模并发下保证推理速度和成本,已经成为决定生死的「隐形战场」。

腾讯方面表示,在过往混元大模型的训练及海量业务实践中,腾讯已积累了系统化的工程能力。此次独立建制,意在进一步强化这一优势,提升 AI 大模型的整体研发效率。

除了算力基建,数据质量和评测体系也被提到了新的高度。

此次升级中,新成立的 AI Data 部 将由刘煜宏负责,专注于大模型数据及评测体系建设;而数据计算平台部则由陈鹏负责,聚焦大数据和机器学习的数据智能融合平台建设。两人均向公司副总裁蒋杰汇报。

这意味着,数据处理不再只是算法研发中的附属流程,而是作为独立且关键的环节被标准化和制度化。

与此同时,王迪将继续担任大语言模型部副总经理,向姚顺雨汇报,确保模型算法团队与新成立的基础设施部门保持紧密协同。


03

效率变革,从代码到产品的「AI 化」

过去两年,尽管拥有微信这样的国民级应用,腾讯在 AI 模型层却一度被外界视为「旁观者」。

一个标志性事件是,今年 2 月腾讯元宝率先接入 DeepSeek R1。虽然这一动作让元宝的活跃用户数实现了数量级跃升,但也给腾讯内部敲响了警钟:自有模型的缺位,甚至导致内部部分业务团队因混元竞争力不足而犹豫是否接入。

这种焦虑最终转化为自上而下的压力。据报道,腾讯总裁刘炽平今年早些时候曾对团队下达硬指标,要求必须在技术水位上赶超对手。此次变革,正是为了解决此前因组织分散导致的资源内耗,集中力量为算法团队输送「弹药」。

架构调整的最终目的,是为了支撑产品和业务的快速奔跑。

在前不久的 12 月 5 日,腾讯发布了混元 2.0,在预训练数据和强化学习策略上进行了显著改进,其 3D 模型甚至保持着全球领先水准,在开源社区下载量突破 300 万。

在应用层,腾讯元宝上线初期保持了「一天一版本」的迭代频率,目前用户规模已稳居国内 AI 应用前三。而在腾讯内部,一场静水流深的 AI 效率变革正在发生:超过 90% 的腾讯工程师正在使用腾讯云代码助手 CodeBuddy;50% 的新增代码由 AI 辅助生成;代码评审环节的 AI 参与度高达 94%。

目前,腾讯混元大模型已在腾讯会议、微信、广告、游戏等内部超过 900 款应用和场景中落地。

近期混元团队的高密度人才引进与重组,本质上正是为了支撑这种高强度的技术攻坚与业务渗透。通过成立 AI Infra 等新部门,腾讯正在试图打通从底层算力、数据处理到上层算法、应用落地的任督二脉,为接下来的 AI 长期竞赛备好粮草。

*头图来源:视觉中国
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

直播预告


2025 年底,当整个 AI 行业陷入落地焦虑与同质化竞争时,曾打造微软小冰的「AI 情感计算之父」李笛,携新公司 Nextie(明日新程)重回视野。李笛眼中的 AI 下半场究竟长什么样?为什么他说理想的产业模型是「定义范式」而非「赛道复制」?

12 月 18 日(周四)20:00,极客公园视频号直播间,极客公园创始人 & 总裁张鹏将对话 Nextie 创始人李笛,聊聊 AI 创业如何跳出「同质化」的死胡同。




更多阅读



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询