我要投稿

腾讯大模型「变阵」：成立 AI Infra 部，姚顺雨出任首席 AI 科学家

发布日期：2025-12-17 19:47:43 浏览次数： 1529

作者：极客公园

微信搜一搜，关注“极客公园”

在混元 2.0 发布两周后，腾讯大模型研发体系完成了一次关键的「系统升级」。

作者｜连冉

编辑｜郑玄

大模型战事进入深水区，腾讯正在通过调整阵型，来适应更快的速度。

12 月 17 日，腾讯宣布升级大模型研发架构。这次调整最核心的变化在于成立了三个新部门：AI Infra 部、AI Data 部、数据计算平台部。

这是腾讯在混元大模型步入 2.0 时代后，对研发体系的一次全面「提速」。

在人事任命上，技术派高管被推向了更核心的位置。Vincesyao 出任「CEO/总裁办公室」首席 AI 科学家，直接向腾讯总裁刘炽平汇报；同时，他还兼任新成立的 AI Infra 部及大语言模型部负责人，向技术工程事业群（TEG）总裁卢山汇报。

一手抓算法（大语言模型部），一手抓算力基建（AI Infra 部），同时直通公司最高决策层，这一配置表明：在腾讯的战略棋盘中，大模型的研究与工程落地正在完成深度耦合。

姚顺雨，98 年的 AI 顶尖青年科学家

据了解，Vinces Yao 就是数月前传闻入职腾讯的姚顺雨，毕业于清华和普林斯顿大学，曾任 OpenAI 研究员。

据外媒报道，自今年 9 月从 OpenAI 离职加入腾讯以来，姚顺雨被高层赋予了极大的权限，以推动内部的文化与组织变革。过去几个月里，腾讯一改往日在大模型人才战中的守势，开始以双倍薪资激进地从字节跳动等竞争对手处挖角核心研究员，并为应届博士生开出高出行业标准 50% 的薪资溢价。

姚顺雨 10 月在 X 上发帖｜图片来源：X

更深层的变化在于「权力交接」。腾讯正在进行内部重组，降级那些虽擅长工程落地和广告算法、但缺乏前沿 AI 研究背景的管理者，将指挥棒真正交还给「研究派」。这种去肥增瘦的动作，旨在打破过去「产品经理思维」主导大模型研发的局限。

姚顺雨出生于 1998 年，是人工智能领域的顶尖青年科学家，本科毕业于清华大学计算机系（姚班），后赴普林斯顿大学攻读计算机科学博士学位，2024 年正式加入 OpenAI，专注于智能体（Agents）与深度研究（Deep Research）方向。

他在 OpenAI 任职及相关研究期间，主要在大模型推理、Agent（智能体）——及评估体系方面取得了核心成果：

提升推理能力：提出了著名的思维树（Tree of Thoughts, ToT），通过让大模型进行多路径推理和反复思考，大幅提升了模型解决复杂问题的能力；

智能体研究：他是 SWE-bench（大模型代码能力评估数据集）和 SWE-agent（开源 AI 智能体）的关键贡献者，并参与了 ReAct（推理与行动结合）和 CoALA（智能体认知架构）等开创性工作。

此外，他还在个人社交平台发布了关于「AI 下半场」的思考，主张 AI 发展的重心应从单纯的训练转向定义问题与评估，提出要像产品经理一样思考「解决什么问题」，认为在当前阶段评估比训练更为重要。

为什么是 AI Infra？

在过去一年的「百模大战」中，行业逐渐达成一个共识：大模型的竞争，早已超越了单纯的算法层面，变成了算力、数据、工程化能力的综合比拼。

此次腾讯成立 AI Infra 部，也是为了解决「算力效率」这一关键命题。

据官方信息，AI Infra 部将作为腾讯大模型体系的重要一环，聚焦于大模型分布式训练、高性能推理服务等核心技术。其目标非常明确：构建大模型 AI Infra 的核心竞争力，为算法研发和业务场景落地提供稳定、高效的技术底座。

这符合大模型技术演进的规律——当模型参数量级不断跃升（如腾讯近期发布的混元 2.0），如何让庞大的 GPU 集群高效运转，如何在大规模并发下保证推理速度和成本，已经成为决定生死的「隐形战场」。

腾讯方面表示，在过往混元大模型的训练及海量业务实践中，腾讯已积累了系统化的工程能力。此次独立建制，意在进一步强化这一优势，提升 AI 大模型的整体研发效率。

除了算力基建，数据质量和评测体系也被提到了新的高度。

此次升级中，新成立的 AI Data 部将由刘煜宏负责，专注于大模型数据及评测体系建设；而数据计算平台部则由陈鹏负责，聚焦大数据和机器学习的数据智能融合平台建设。两人均向公司副总裁蒋杰汇报。

这意味着，数据处理不再只是算法研发中的附属流程，而是作为独立且关键的环节被标准化和制度化。

与此同时，王迪将继续担任大语言模型部副总经理，向姚顺雨汇报，确保模型算法团队与新成立的基础设施部门保持紧密协同。

效率变革，从代码到产品的「AI 化」

过去两年，尽管拥有微信这样的国民级应用，腾讯在 AI 模型层却一度被外界视为「旁观者」。

一个标志性事件是，今年 2 月腾讯元宝率先接入 DeepSeek R1。虽然这一动作让元宝的活跃用户数实现了数量级跃升，但也给腾讯内部敲响了警钟：自有模型的缺位，甚至导致内部部分业务团队因混元竞争力不足而犹豫是否接入。

这种焦虑最终转化为自上而下的压力。据报道，腾讯总裁刘炽平今年早些时候曾对团队下达硬指标，要求必须在技术水位上赶超对手。此次变革，正是为了解决此前因组织分散导致的资源内耗，集中力量为算法团队输送「弹药」。

架构调整的最终目的，是为了支撑产品和业务的快速奔跑。

在前不久的 12 月 5 日，腾讯发布了混元 2.0，在预训练数据和强化学习策略上进行了显著改进，其 3D 模型甚至保持着全球领先水准，在开源社区下载量突破 300 万。

在应用层，腾讯元宝上线初期保持了「一天一版本」的迭代频率，目前用户规模已稳居国内 AI 应用前三。而在腾讯内部，一场静水流深的 AI 效率变革正在发生：超过 90% 的腾讯工程师正在使用腾讯云代码助手 CodeBuddy；50% 的新增代码由 AI 辅助生成；代码评审环节的 AI 参与度高达 94%。

目前，腾讯混元大模型已在腾讯会议、微信、广告、游戏等内部超过 900 款应用和场景中落地。

近期混元团队的高密度人才引进与重组，本质上正是为了支撑这种高强度的技术攻坚与业务渗透。通过成立 AI Infra 等新部门，腾讯正在试图打通从底层算力、数据处理到上层算法、应用落地的任督二脉，为接下来的 AI 长期竞赛备好粮草。

*头图来源：视觉中国

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

直播预告