微信扫码
添加专属顾问
我要投稿
谷歌I/O大会发布20余款产品,核心信息只有一个:AI正从聊天助手进化为能24小时独立工作的智能代理。核心内容: 1. 新一代AI模型Gemini 3.5 Flash与Omni在性能与性价比上的突破 2. 云端AI代理Gemini Spark实现全天候离线任务处理 3. AI能力全面融入搜索、办公及创作工具的实际应用
AI范儿 · 今日速评⏱ 6 分钟
昨晚谷歌 I/O 2026 开完了,我粗略数了一下,他们一口气发布了超过 20 个东西。
按惯例这种时候应该写一篇「10 大亮点」,但我总觉得那种文章读完什么都没记住。
所以这篇换个思路,不堆功能,只聊一件事:谷歌在这届 I/O 上到底想说什么?
Agent 时代来了,AI 从帮你聊天,变成帮你干活了。这就是整场发布会最硬的一句话
接下来拆一下最值得关注的几块。
01模型翻身
谷歌这次发布了 Gemini 3.5 Flash 和 Gemini Omni 两个新系列。
Gemini 3.5 Flash是这次的主力。在编程、多模态和 Agent 任务的跑分上,全面超过了上一代旗舰 Gemini 3.1 Pro。
速度是同类前沿模型的 4 倍。Agent 专项基准测试 MCP Atlas 上跑出了 83.6%,比 GPT-5.5 还高。
API 定价比 Gemini 3.1 Pro 便宜约 40%,上下文窗口 100 万 token,今天已经全面铺开到 Gemini app、Search、Antigravity 2.0 和 API。
Flash 系列以前是「便宜但聪明程度打折」的代名词。
这次翻身了。
另一个是 Gemini Omni,定位跟之前的 Veo 系列完全不同。
Veo 主要是文字生视频;Omni 能接受图片、音频、视频、文字的任意组合作为输入,然后生成并编辑视频。
你拍一段素材丢进去,用说话的方式改掉里面的人物、背景、场景,它还理解真实世界的物理规律,比如重力、流体之类的,让输出更真实。
这个功能谷歌自己也说要「谨慎部署」。
毕竟能随便改视频里的人和内容,这个潘多拉盒子不是谁都敢随便打开的。
目前每个 Omni 生成的视频都会带上 SynthID 数字水印。
Omni Flash 今天已经开始通过 Gemini app、Google Flow 和 YouTube Shorts 滚动推送。
02云端代理:谷歌版小龙虾
整场发布会讲得最用力的是 Gemini Spark。
Gemini Spark是谷歌推出的个人 AI 代理,运行在谷歌云的虚拟机上,可以 24 小时不间断运转,不需要你一直开着电脑。
它的定位很直接:谷歌版 OpenClaw。
能写邮件、生成学习资料、帮你盯着信用卡账单查隐藏费用,接入了 Gmail、Docs、Sheets、Slides,以及 Canva 和 Instacart 等第三方应用。
今年夏天还计划通过 MCP 协议继续扩展。
这一句「不需要开着电脑」,才是关键。
以前的 AI 产品,你不开它它就不动。OpenClaw 用户对这个感受最深。虽然功能强,但你得守着机器。
Spark 不一样,它在谷歌云的虚拟机上跑,任务不依赖你本地的环境,关了盖子它还在干活。
举个例子:你让 Spark 帮你监控某个竞争对手的官网价格,发现降价了就给你发邮件汇报。
Gemini Spark 下周先开放给美国 Google AI Ultra 订阅用户,今年夏天扩展到 Chrome 浏览器。
03搜索变身
谷歌说这是搜索框 25 年来最大的一次升级。
现在支持图片、视频、文件直接丢进去问,搜索框会随着你输入越来越长自动变大。
个人数据这块也放开了,Gmail、相册都能接进来用,近 200 个国家免费用上 AI Mode。
更重磅的是 Search 里的 Agent 功能。
你丢个需求它就 24 小时自动蹲守全网,找到合适的房子、球鞋联名款主动推送给你。
还能代打电话订位、写代码生成专属小工具,甚至给你搭个健身追踪仪表盘。
谷歌想让 Search 变成一个会主动送情报上门的私人助理,而不只是你问它才答的工具。
目前 AI Mode 月活已经超过 10 亿,AI Overviews 月活 25 亿。
Pichai 在演讲里说,Search 已经越来越不像是「查一次就走」,更像是一段持续进行的对话。
04编程平台
去年底谷歌发布了 Antigravity,定位是 Agent 优先的编程平台,对标 Cursor 和 Claude Code。
这次 I/O 直接升级到 2.0,力度不小。
核心变化是从「单个 AI 编程助手」变成「多 Agent 调度平台」。
你可以同时启动多个 Agent 并行处理不同任务,设定定时任务让它在后台自动跑,还可以用语音下指令,不用打字。
现场演示里,Antigravity 2.0 用 93 个子 Agent 协作,12 小时从零搭出了一个能运行 Doom 的操作系统,全程 API 费用不到 1000 美元。
能不能跑 Doom 是一回事,这个成本和速度是另一回事。
同时,Gemini CLI 正式退场,6 月 18 日起停止服务,用户需要迁移到新的 Antigravity CLI。
定价上新推出了 $100/月的 AI Ultra 入门档,是 Pro 版使用量上限的 5 倍,跟 OpenAI 和 Anthropic 的 $100 档正面对齐。
05眼镜再来
谷歌和三星、高通搞了个 Android XR 平台,今年秋天先上「音频眼镜」。
喊一句「Hey Google」就能问 Gemini 周边信息、导航指路、发消息听歌,还能拍照让 AI 处理。
外壳由 Gentle Monster 和 Warby Parker 联名设计,看起来终于不像科技宅专属了。
后续还有带显示屏的版本,Android 和 iPhone 都能配对。
这个方向和 Meta Ray-Ban 智能眼镜现在的打法高度相似。
区别在于谷歌背后有整个 Gemini 生态在撑着,Agent 能力理论上会更强。
今年秋天见真章。
06边角猛料
还有些有意思的边角料,也值得单独拎出来。
谷歌宣布了 Universal Cart,一个跨平台的 AI 购物车。
在 Gmail、YouTube 或任意网页看到想买的东西,都能加进这个统一的购物车,统一结账。
它会自动监测价格变动,还能识别你买的配件是否互相兼容。
演示里是 PC 配件的例子,用户选的主板和 CPU 插槽不匹配,购物车主动提醒并给出替代方案。
YouTube 上线了 Ask YouTube,可以处理复杂问题和追问,目前向美国 Premium 用户开放。
Nano Banana 模型这一年生成了超过 500 亿张图片。
Pichai 说这是「过去一年最出圈的明星产品」。
07写在最后
Pichai 在演讲里报了一个数:两年前谷歌每月处理 9.7 万亿个 token,去年 I/O 时涨到 480 万亿,今天这个数字是 3.2 千万亿。(1 年直接涨了 7 倍)
「没想到有一天会在 I/O 的演讲里说‘千万亿’这个单位。」
规模在,速度在,方向也很清楚。
坦率说,这届 I/O 谷歌发的东西非常多,但主题就一个:跑通 Agent 闭环,把 Gemini 塞进你数字生活的每一个角落。
当 AI 真的能 24 小时在后台替你干活,你准备让它干什么?这个问题,比「谷歌发了什么」更值得想一想
如果你有一个 24 小时在线的 AI 代理,第一件事会交给它干什么?
觉得有用 → 点个❤️在看转给朋友
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-20
直击 Google I/O 2026 | 轰炸式发布 Agent,狙击 Claude Code,开战!
2026-05-20
I/O 2026:欢迎来到智能体 Gemini 时代
2026-05-20
首个Gemini桌面端曝光,系统级Agent空降PC!
2026-05-20
一文看懂 Google I/O 2026:Gemini 3.5领衔 谷歌打响智能体和全模态大战
2026-05-20
帮大家总结了一下凌晨的Google I/O 2026开发者大会。
2026-05-19
Harness Engineering:AI 能在真正"出事会炸"的后端系统里写代码吗?
2026-05-19
可能是一份最详细的保姆级Codex教程,看完你就知道它为什么最近这么火
2026-05-19
为什么我在团队大力推进 Harness Engineering 的同时,却不认为它就是未来
2026-04-15
2026-03-31
2026-03-13
2026-04-07
2026-03-17
2026-03-17
2026-04-07
2026-03-21
2026-04-24
2026-02-20
2026-05-19
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07
2026-04-26
2026-04-22