微信扫码
添加专属顾问
我要投稿
OpenAI的Codex Chrome插件彻底解放双手,自动填表、报销、舆情分析甚至多代理协同游戏,让浏览器操作进入全新时代。 核心内容: 1. 插件核心能力:直接操作已登录浏览器实现跨平台自动化 2. 三大硬核功能:身份共享/多标签页并行/多代理协同 3. 实际应用场景:舆情调研/差旅报销/在线协作绘画等复杂任务
现在的 OpenAI,越来越像 Anthropic 了,几乎每天都有新东西发布。
昨天晚上除了发布三个新的语音模型之外,他们还上线了一个 Codex 的 Chrome 插件。
这个插件最核心的能力,就是它终于可以直接操作你已经登录好的浏览器了。
Codex 之前本来就内置了浏览器吗,但它没法操作那些需要登录的网站。
比如你的邮箱、小红书、微博、公司后台、会员系统、企业工作台……
这个能力,其实有点像之前很多人用过的 Claude for Chrome,现在 OpenAI 也加上了。
要使用很简单,先更新 Codex,然后到 Plugin 里面安装 Chrome 插件:
安装完之后,就可以直接在 Codex 里面 @Chrome 来操作了,比如我让它帮我自动发个微博:
然后就看到一条微博自动发好了,内容也都是它自己编辑的:
这个例子太简单了,主要是为了要演示一下基本功能。
但说实话,看了昨晚的演示视频,这玩意的上限远不止发个微博这么简单。
视频里提到了几个非常硬核的功能: 首先是“身份共享”。
因为它是以插件形式运行在你的 Chrome 里的,所以它能直接调用你浏览器里的所有 Cookie 和登录状态。
这意味着它不需要你再输一遍账号密码,就能在你的“真实工作环境”里折腾,安全性也比把账号托管给第三方强。
其次是“多标签页并行”。它可以同时监控、抓取好几个网页里的内容,甚至能跨标签页执行任务。
为了展示这个能力,视频里跑了几个更复杂的案例,看得我心痒痒:
第一个是“全自动舆情调研”。
演示里让 Codex 去 OpenAI 的官方社区里逛逛,它不只是扫一眼,而是自己会翻页、抓取最近一周的所有帖子,然后分析哪些用户在吐槽、哪些在夸,最后直接在你浏览器里生成一个表格总结。
这种以前要写爬虫干的活,现在一句话就搞定了。
第二个是“差旅报销闭环”。
这个非常实用,它先去 Gmail 插件里翻找最近的出差收据,把日期、金额全抠出来。
然后,重点来了。
它自动打开了报销网站,把收据 PDF 传上去,顺带把表单里的每一个空格都填好了。
这种跨平台(邮件到网页)的自动流,才是真的解放双手。
最离谱的是最后一个演示,“多代理协同”。
视频里开了四个标签页,跑了四个 Codex 代理去玩一个在线协作绘画游戏。
它们能实时看到对方画了什么,然后商量着一起补全一幅画。
这种“群聊式”的网页操控,给未来的办公协同留足了想象空间。
这个插件是在单独的标签页里面处理这些新任务的,所以它不是完全接管了你的浏览器。
也就是说,你还可以继续在浏览器里干你的事情,而它在后台默默地帮你把那些自动化的事情处理掉。并不是说它在运行的时候,你就不能用浏览器了。
总之,OpenAI 这次补齐了 Codex 最关键的一块拼图。
以后我们用的可能不再是一个聊天框,而是一个能跑在任何网页背后的“数字员工”
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-06
Anthropic 和 OpenAI,同一天成立合资公司
2026-05-05
Cursor Team Kit 官方发布,团队使用 Cursor 最佳实践完全公开:17 Skills、1 Agent、2 Rules
2026-04-30
Claude Cowork:我的第一个数字员工,从香港公司对账开始
2026-04-29
一大批中层,即将消失
2026-04-29
Harness Engineering实践,做了一个平台让AI一晚上自动评测和优化你的系统
2026-04-28
我用两周时间,用 AI Agent 重构了公司的协作和沟通方式
2026-04-26
AI时代给人类留了最后一份工作,是农民
2026-04-24
企微变“灵”了!全新“面聊”等多功能上线
2026-03-20
2026-03-19
2026-03-17
2026-03-19
2026-03-03
2026-03-26
2026-03-21
2026-03-05
2026-02-11
2026-03-25
2026-03-21
2026-03-07
2026-02-06
2026-01-27
2026-01-08
2025-12-29
2025-12-28
2025-12-21