收藏

2025，OpenAI 急着给 AI Agent 上大菜！

发布日期：2025-03-13 07:32:33 浏览次数： 2679

作者：AI信息Gap

微信搜一搜，关注“AI信息Gap”

2025年，AI Agent 爆发之年。

AI Agent，国内有一个很“雅致”的名字：智能体。

关于 AI Agent，OpenAI 首席产品官（CPO）Kevin Weil 给出了这样的定义：能够自主执行任务的系统。

其实 agent 一词在英文中愿意为“代理”，AI Agent，即 AI 代理，意为能够代理你独立自主地执行任务的 AI。这样是不是更好理解了。

OpenAI 自2025年以来已经发布了两款基于 ChatGPT 的 AI Agent：

可以代替你操作浏览器，自主执行任务的 Operator：OpenAI正式发布Operator，一款能操作浏览器的AI，打响2025智能体大战第一枪！
可以帮助你做深入的研究，整合海量在线信息，生成专业研究报告的 Deep Research：OpenAI的第二个AI Agent：Deep Research完全解读！

遗憾的是，尽管 OpenAI 吹得再响，这两个 AI Agent 并没有在市场上激起特别大的浪花。

反而是来自我国的 Manus AI，火得破了圈。好不好用不知道，但火，那是真火。

OpenAI 急啊，恐怕是急的要跳脚，遂于北京时间3月12日凌晨，突然的、毫无预热的、不符合其风格的举行了一场直播发布会。

整场发布会时长19分钟，发布的内容总结起来就是“3 + 1 + 1”：三个工具（tools）；一个新 API（Responses API）；一个新 SDK（Agents SDK）。

1. Web Search Tool（联网搜索工具）

大语言模型本身是不能联网搜索的，只能依据其训练数据生成答案。但为什么有的 AI 产品，比如 DeepSeek，就支持联网搜索实时内容，然后回答？

因为联网搜索工具。

联网搜索工具，也就是这次发布的 Web Search Tool，能够提供给模型实时的互联网上的内容作为上下文/背景信息，从而使得模型的回答更加实时和准确。

OpenAI 的这个联网搜索工具由经过微调的 GPT-4o 或 GPT-4o mini 提供支持，和 ChatGPT 中的搜索功能是一样的。

这个工具对于构建需要实时、公开的外部数据支持的 AI Agent 很有用。不过，类似的替代品也有很多，比如谷歌搜索、Perplexity API 等等。

在 SimpleQA 基准测试中，GPT-4o + 联网搜索工具达到了90% 的 SOTA（state-of-the-art）准确率。

2. File Search Tool（文件搜索工具）

严格来说，这不是一个新功能。OpenAI 早在去年就在 Assistants API 中推出了该功能，支持开发者上传、切分、嵌入文档，实现高效的 RAG（Retrieval-Augmented Generation，检索增强生成）。

想让一份非结构化文档，比如 PDF，变成 AI-ready 的数据，RAG 是绕不开的话题。

OpenAI 这一次是在之前的基础上增加了两个新功能：

元数据过滤（Metadata Filtering） ：更丰富的元数据，意味着更精准、高效的查询和筛选。
直接搜索端点（Direct Search Endpoint） ：有了它，开发者就可以直接在向量存储（Vector Store）中查询，而无需经过模型预处理。

3. Computer Use Tool（计算机操作工具）

高能预警，接下来出场的这位是重磅选手：Computer Use Tool。

如何让 AI 模型像真人一样操作你的电脑？

传统的方案是 API 接口调用。但这并不适用于大模型，因为太死板。

这里就要用到这个叫做“Computer Use”的工具。最早提出这个概念和工具的其实并不是 OpenAI，而是开发 Claude 的 Anthropic。

OpenAI 算是把这个概念给“发扬光大”了，直接把 Computer Use Tool 用到了前面提到的 Operator 这个 AI Agent 里。简单来说，这个工具就是借助了 GPT-4o 模型的视觉能力，让 AI 能够看懂电脑当前的页面内容，然后模拟真实用户进行鼠标和键盘操作，最终实现“操作电脑”的效果。OpenAI 把这个新模型称为 CUA（Computer-Using Agent）。

4. 全新的 Responses API

上面介绍的三个 AI Agent 工具很香，但如果想要同时调用它们怎么办？

OpenAI 原本的 Chat Completions API 肯定是无法满足这个需求的。

基于此，OpenAI 推出了全新的、更灵活易用的 Responses API。

Responses API 使用起来极其简单，支持多步操作，多个工具调用，并且支持多模态输入。

比如，Responses API 可以同时调用 RAG 和联网搜索工具。

再比如，Responses API 可以直接调用 Computer Use Tool 在浏览器中自动完成商品购买流程。这是活脱脱复刻了一个小版的 Operator 啊。

5. 全新的 Agents SDK

Agents SDK，听起来高大上，但不是一个新东西。

Agents SDK 的原型是 OpenAI 去年10月发布并开源的（是的，你没有看错，是开源）一个多智能体工具：Swarm。详情看这里：OpenAI低调发布多智能体工具Swarm：让多个智能体协同工作！

Swarm 的主要用途是构建、管理和编排多个 AI Agents。此前 Swarm 一直处于实验性阶段，而现在 OpenAI 正式发布，并给它取了一个好听的名字：Agents SDK。

Agents SDK 让创建 Agent 变得更简单。同时支持多智能体编排（Agent Orchestration），允许不同 Agent 之间切换（Handoff）。

比如，可以从专门负责客户支持的 Agent 自动切换到专门负责退款的 Agent，以完成不同的任务。

同时，Agents SDK 配有一套 Tracing UI（监控界面），用于监测和调试 Agents 的功能。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-02

天工 3.2 重磅升级：Skywork Tags 上线，给 Agent 一张工牌，邀其加入你的工作群聊

2026-07-02

Context Infra 会是 AI 领域的下一个热点

2026-07-01

一文了解｜SkillScan 智能体技能安全扫描最佳实践

2026-07-01

协作的逆向演进：从 Agent 逻辑重构团队管理

2026-07-01

港科大郭毅可谈Agentic AI时代的核心命题：人机共生，人不可能退场

2026-07-01

Sonnet 5终于来了，然而Opus 4.8现在有点尴尬

2026-07-01

AI可观测性：Prompt、Tool Call、Trace、Token全链路追踪

2026-07-01

AI Infra 全景图：Agent Framework、调度、编排、沙箱、记忆管理、Tracing 分层拆解

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

OpenAI Codex CLI 完整使用指南

2026-04-07

Claude Code 和 Codex 接入 Figma MCP 保姆级教程

2026-04-07

GPT5.5来了，最大特点解析

2026-04-24

Claude Opus 4.7 发布，全网最详细解读

2026-04-17

GPT-6，曝光了

2026-04-05

重磅！GPT-6曝光了

2026-04-05

Hermes Agent模型配置小白指南

2026-04-14

一文读懂DeepSeek V4：1.6万亿参数、百万上下文、华为芯片

2026-04-24

GPT-Image-2 全量上线，中文顶到爆，50+ Case 生图实测

2026-04-22

大家都在问

微信AI，能避开豆包手机的窘境吗？

2026-06-30

AgentTeams 和 Claude Tag 都进入群聊模式，是新范式还是新叙事？

2026-06-27

Agent 从 Demo 到生产级，中间到底差什么？

2026-06-26

微信在金矿上孵化了啥？

2026-06-25

企业智能体的下半场，如何让智能体越用越聪明？

2026-06-18

Agent 记忆，我们全都理解错了？

2026-06-18

如何利用 Harness “一句话交付产品功能”？

2026-06-10

Loop Engineering 循环工程又是什么鬼？

2026-06-10

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部

扫码登录

登录即表示您同意《53AI网站服务协议》

服务协议

欢迎您使用【53AI 官方网站】（以下简称“本网站”或“我们”）。本《会员服务协议》（以下简称“本协议”）是您（以下简称“会员”或“用户”）与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前，请务必审慎阅读、充分理解各条款内容，特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时，即视为您已完全理解并同意接受本协议的全部内容。

一、定义

本网站：指由【深圳市博思协创网络科技有限公司】运营的，域名为【53ai.com】的网站及相关移动端页面。

会员服务：指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容：指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、账号注册与登录

登录方式：本网站支持以下登录方式，您可根据实际情况选择：

微信公众号授权登录：您同意将您的微信OpenID信息授权给本网站，用于创建或关联会员账号。

手机验证码登录：您需提供真实有效的手机号码，并通过短信验证码完成身份验证与登录/注册。

账号安全：您的账号仅限您本人使用，禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失，由您自行承担。

实名认证：根据相关法律法规要求，我们可能要求您在特定功能下完成实名认证。如您拒绝提供，可能无法使用部分或全部服务。

未成年人保护：若您未满18周岁，请在法定监护人的陪同下阅读本协议，并在征得监护人同意后使用本服务。

三、服务内容与规范

知识库查阅权限：会员登录后，有权按照其会员等级对应的权限范围，在线浏览、检索本网站知识库中的相关文章及内容。

服务变更：我们有权根据业务发展需要，调整、变更或终止部分服务内容，并将以网站公告、公众号消息等方式提前通知。

禁止行为：您在使用服务时不得实施以下行为：

利用技术手段批量爬取、下载、转存知识库内容；

将知识库内容用于商业目的或未经授权地向第三方传播；

干扰本网站正常运行或侵犯其他用户合法权益；

发布违法违规信息或从事违反公序良俗的活动。

四、知识产权声明

权利归属：本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有，受《中华人民共和国著作权法》等法律保护。

有限许可：本网站授予会员一项非独占、不可转让、不可转授权的普通许可，仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责：未经书面许可，任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现，我们保留追究其法律责任的权利。

五、个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息，请单独阅读《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息，我们将严格按照《个人信息保护法》的规定处理，仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、免责声明

内容准确性：知识库内容仅供参考，不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证，您应自行判断并承担使用风险。

不可抗力：因自然灾害、政策法规变化、网络故障、第三方平台接口异常（如微信接口维护、运营商短信通道故障）等不可抗力导致的服务中断或延迟，我们不承担违约责任。

第三方链接：本网站可能包含指向第三方网站的链接，该等网站的内容和服务不受我们控制，请您自行甄别风险。

七、违约责任

如您违反本协议约定，我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施，并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失，您应承担全部赔偿责任（包括但不限于罚款、赔偿金、律师费、公证费等）。

八、法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议，双方应友好协商解决；协商不成的，任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、其他

本协议构成双方就本服务达成的完整协议，取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的，不影响其他条款的效力。

我们对本协议享有最终解释权，并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效，继续使用服务即视为同意修订内容。

已查阅