微信扫码
添加专属顾问
我要投稿
英伟达GTC大会再创纪录,但技术突破是否还能点燃你的激情? 核心内容: 1. CUDA二十周年与DLSS 5技术发布 2. 算力巨兽Vera Rubin平台的震撼亮相 3. 200亿美元收购Groq的战略布局
英伟达一年一度的 GTC 已经变成了一个行业盛会,而今年的 GTC 热度不仅没减,人数反而创了历史新高,比去年多了 5000 多人(20%)。
这样的规模使得圣何塞会议中心都塞不下,老黄的演讲最近几年都在更大的 SAP Center 举行。(用来办演唱会的地方)
尽管如此,挤了 3 万多人的 SAP Center 还是没扛住,现场 WIFI 和手机信号全部瘫痪了,所以很多人还是选择在家看直播。
1. 那些被低估的前菜:CUDA 二十岁与 DLSS 5
老黄一上来没急着发新卡,而是先大打感情牌,庆祝了自家护城河 CUDA 的 20 岁生日。
他还调侃了一句大实话:“GeForce 就是英伟达史上最成功的营销活动。”
确实,没有当年咱们买游戏显卡的钱,哪来今天满世界的 AI 计算?
顺带一提,老黄还给游戏党和渲染党发了个福利:DLSS 5 来了,主打一个“3D引导的神经渲染”,画面党狂喜。
但前菜过后,正餐立刻端了上来。
老黄甩出一个极其夸张的预测:因为 ChatGPT 和像 Claude Code 这种具备“推理和行动”能力的 AI 爆发,到 2027 年,全球对算力的需求将高达 1 万亿美元!
那么,这泼天的富贵,英伟达打算怎么接?
2. 算力终极巨兽:Vera Rubin 与“插满 GPU 的墙”
这就得请出今天的主角:Vera Rubin 平台。
如果你还停留在“买张显卡插在电脑里”的思维,那格局就小了。
现在的 AI 算力,根本不是按“张”卖,而是按“柜”卖,老黄在感叹他现在不能再只举起一块芯片了。
这次最震撼的硬件形态,是Rubin Ultra 配合全新的 Kyber 机架。
这玩意儿有多离谱?它不是像抽屉一样横着推进机柜的,而是垂直安装的!
前面全是算力卡,后面全是 NVLink 互联网络。一个机柜里密密麻麻塞了 144 颗 GPU。
而且,传统风冷早就压不住这些核弹了。
老黄直接展示了 45 度温水液冷技术:未来的数据中心,连一根杂乱的线缆都看不见(全部移除了),全靠水流带走恐怖的热量。
同时,老黄还顺手发布了独立的 Vera CPU 机架,以及搭配 BlueField-4 DPU 的上下文内存存储平台(KV Cache),把存储厂商全拉上了自己的贼船。
3. 豪掷 200 亿买下 Groq,底牌终于揭晓
接下来,是全场最硬核,也是业内最关注的焦点:英伟达去年底花了 200 亿美元收购的当红炸子鸡 Groq,到底拿来干嘛?
懂行的朋友可能会问,英伟达自家 GPU 吞吐量那么猛,图啥?
老黄现场给出了答案,这也是我认为整场发布会最精妙的商业阳谋:“分离推理”(Disaggregated Inference)。
我打个通俗的比方:Vera Rubin 就像是大学里的老教授(GPU擅长吞吐和预填充),能一口气读完一万本书。而 Groq 的 LPU 就像是反应极快的抢答选手(LPU擅长极低延迟的解码)。
老黄用自家的软件把这俩缝合在一起:让 Rubin 负责读题,让 Groq 负责飞速往外蹦答案。
这套组合拳一出,在高频对话场景下,硬生生把性能拉高了 35 倍!这也解决了 NVL72 带宽不足的问题。
这意味着,如果你的公司只做高吞吐,买 Rubin 就行。如果要做实时语音交互的 AI,那你得再买点 Groq 的芯片加进去。
老黄还剧透了:今年下半年三星代工的 Groq LP3 就会发货。
老黄透露,Vera Rubin的采样进展非常顺利。Azure已经完成了他们的第一个机架部署。“我们已经全面投产了”
而且 2028 年,下一代代号为 Feynman(费曼) 的 GPU 和新 CPU Rosa 已经在路上了。
这更新速度,根本不给对手喘息的机会。
4. 属于全人类的“HTML 时刻”:OpenClaw 诞生
小龙虾 OpenClaw 几乎一夜之间爆炸,老黄将它视为过去 30 年来最重要的开源发展之之一。
老黄极其隆重地推出了一个英伟达版的小龙虾:NemoClaw。
他甚至用了最极端的词来形容:“这玩意儿的意义,堪比当年互联网诞生时的 HTML!”
简单来说,这是一个专门用来“捏” AI Agent(智能体)的操作系统。
这一点我非常认同,OpenClaw 就像一个操作系统,而我们安装的各种 Skills 就是那些 APP。
以前企业想搞个 AI 员工,得养一帮程序员。现在,在 NemoClaw 上像搭积木一样,就能配出一个会自己读文件、发邮件、跟进客户的赛博打工人。
老黄甚至预言,未来每个工程师入职,公司除了发电脑,还会给你发一笔“Token(算力)预算”。(老黄不知道?中国已经有公司这么做了)
NVIDIA 正在与 OpenClaw 开发者合作,使OpenClaw 适用于企业使用。
英伟达甚至推出了“小龙虾”OpenClaw 智能体平台的 NemoClaw 软件栈,主打“一键安装”体验。
看来小龙虾的火,不止在中国。
5. 从虚拟到现实:上天、建厂与造人
最后,英伟达的野心彻底冲出了屏幕。
老黄反复强调一个词:物理 AI(Physical AI)。
造人(机器人): 联合比亚迪、丰田搞自动驾驶就不说了,现场甚至牵出了迪士尼那个会走路的雪人机器人 Olaf。
虽然在 30 度的圣何塞展示雪人有点黑色幽默,但意思很明确:未来的 AI 是长着手脚、能在真实世界里干活的。
写在最后
天快亮了。
2 个多小时的发布会看下来,我似乎变得比以往平淡了很多,没有以往那么振奋。
老黄的演讲流程似乎都固化了,但除了性能又提高了多少倍,似乎没什么真正让我觉得震撼的东西。(记得有一年跟一排机器人在一起,还是让人眼前一亮)
以往除了重头戏GPU,物理 AI 总让人觉得异常科幻。而现在这部分只是一笔带过了,看来物理世界的进展并不理想。也可能是市场终于回归一种理性了,不再爆出各种让人一惊一乍的“黑科技”了。
另外,今年爆出得金句似乎也不多,甚至乎没有?参数讲多了真感觉乏善可陈,好了,通宵码字实在肝不动了。你觉得这次发布会有啥亮点?评论区聊聊,我去补觉了。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-17
在 AI 替你干活之前,Violoop 先给它装一个物理刹车
2026-03-16
探展绿联:原生内嵌 MiniMax,OpenClaw 开箱即用,AI NAS 正在破圈
2026-03-10
小团队高效能:Android Studio 中的 Gemini 助 Ultrahuman 实现 15% 研发提速
2026-03-10
从Siri到字节AI手机,再到Xiaomi miclaw:你的AI管家来了
2026-03-07
为什么「龙虾」首先出现在电脑,而不是手机?|AI 器物志
2026-02-22
GPU要凉?前英伟达AMD大神将AI刻在芯片上!17000 tokens/秒屠榜
2026-02-22
手机芯片就能跑的AI视觉大模型!这家创业公司基于国产算力干出全球SOTA水准
2026-02-22
仅70块钱的板子256M内存跑起了10亿参数大模型,这个项目让我惊掉下巴,这是真大佬,我服
2026-01-29
2026-01-13
2025-12-28
2025-12-22
2025-12-31
2025-12-23
2025-12-21
2026-01-02
2025-12-23
2026-01-03