2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

Agent 工程终于有脚手架了, Google开源一个开发agent的工具

发布日期:2026-07-04 07:56:17 浏览次数: 1510
作者:硅基铁匠

微信搜一搜,关注“硅基铁匠”

推荐语

Google开源agents-cli,为AI Agent开发提供从创建、测试到部署的全流程工程化支持,终结工具链断裂的痛点。

核心内容:
1. 工具定位:将常见编码助手转化为更懂Google Cloud Agent Platform的开发助手
2. 核心能力:注入7类工程技能,覆盖开发、评估、部署、观测全生命周期
3. 设计目标:将Agent项目从Demo推向可交付的企业级应用

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

Karpathy 前段时间把一个词讲热了:Agentic Engineering 。它听起来很抽象,落到项目里,其实就是三件事:先把需求写清楚,再用评估反复压问题,最后把安全、权限、部署、观测这些工程活补齐。

过去做 Agent,最容易卡在中间。写代码在编辑器里,起项目在终端里,测试要开浏览器,部署要进云控制台,评估还要再接一套框架。每一步都能做,但每换一个工具,脑子里的上下文就丢一截。

Google 这个 agents-cli 解决的正是这段断裂。它并不提供一个新的聊天机器人,也不替代 Claude Code 、 Codex 、 Cursor 。它更像一套给 coding agent 装上的工程技能包,让这些 coding agent 知道怎么用 Google 的 ADK 、 Agent Runtime 、 Cloud Run 、 Gemini Enterprise 去搭、测、发一个企业级 Agent 。

GitHub 上的定位很直白:agents-cli 是一套 CLI 和 skills,用来把常见 coding assistant 变成更懂 Google Cloud Agent Platform 的开发助手。

它支持 Antigravity CLI 、 Claude Code 、 Codex,也可以配合其他 coding agent 。安装后,它会给 coding agent 注入 7 类技能:

  • google-agents-cli-workflow:Agent 开发生命周期和代码保留规则。
  • google-agents-cli-adk-code:ADK Python API 、 tools 、 callbacks 、 state 等写法。
  • google-agents-cli-scaffold:创建、增强、升级 Agent 项目。
  • google-agents-cli-eval:评估集、指标、 LLM-as-judge 、 rubric 。
  • google-agents-cli-deploy:Agent Runtime 、 Cloud Run 、 GKE 、 CI/CD 、 secrets 。
  • google-agents-cli-publish:注册到 Gemini Enterprise 。
  • google-agents-cli-observability:Cloud Trace 、日志和观测接入。

这个设计的重点不止是“又多一个命令行工具”。它想把 Agent 项目从 demo 拉到可交付状态。能创建项目只是第一步,能测试、能部署、能被组织里的人找到,才算走完。

第一步:安装

准备好 Python 3.11+、uv 和 Node.js 后,直接跑:


    
    
    
  uvx google-agents-cli setup

如果只想装 skills,让自己的 coding agent 接管后面的工作,也可以用:


    
    
    
  npx skills add google/agents-cli

装完后打开你常用的 coding agent,比如 Claude Code 、 Codex 、 Cursor 或 Antigravity CLI,让它按自然语言指令去创建项目。

第二步:让 coding agent 搭一个 RAG Agent

一个可复现的起手式是:


    
    
    
  Build a RAG agent that ingests documents, retrieves relevant context,
and answers questions with source citations. Use the ADK agentic_rag
template with Gemini 3.5 Flash.

在 Akshay 的测试里,Claude Code 调用了 agents-cli 的 ADK skills,从 agentic_rag 模板搭出项目,用 Vector Search 做 datastore,还补了 citation 相关逻辑:回答必须有引用,retriever 返回文档时带 source ID 。

这一步很关键。很多 RAG demo 只演示“能答”,企业里更关心回答有没有资料依据。引用链如果一开始没设计,后面再补会很麻烦。

第三步:本地先测一轮

项目起来后,让 coding agent 启动 ADK Web UI:


    
    
    
  Spin up a local dev server so I can test this.

本地测试至少看两类问题。

第一类是资料里能回答的问题,比如 “how to merge two dictionaries?”,Agent 应该能检索到对应内容,解释 | 合并和 update() 方法,并附上类似 [source: 1003] 的引用。

第二类是资料里没有的问题,比如 “who won the FIFA World Cup in 2022?”,Agent 应该承认资料不足,不能凭常识硬答。 RAG 项目上线前,这类拒答测试比“答得很顺”更有价值。

第四步:上线前做评估

很多 Agent 项目死在这里:demo 能跑,评估没有。 Karpathy 提过一个数据,运行 Agent 的团队里,做 observability 的比例高于做 evals 的比例。可没有 evals,日志再多也很难判断改动有没有把系统弄坏。

可以直接让 coding agent 生成评估集:


    
    
    
  Generate 20 test scenarios for this RAG agent covering correct retrieval,
insufficient context where the agent should say it doesn't know,
multi-hop questions, and citation accuracy. Run the full eval suite and
show me the results.

这 20 个 case 可以分成四组:

  • • 6 个正确检索问题;
  • • 5 个资料不足时的拒答问题;
  • • 5 个需要多文档推理的问题;
  • • 4 个 citation accuracy 问题。

Akshay 的测试结果里,引用准确率 20/20,通过。但 eval 也抓到一个洞:当问题不在语料里时,Agent 有时会补一句通用知识。问题来自 instruction 里的一行宽松规则,大意是“简单问题可以不用工具直接回答”。删掉这行,拒答行为才会稳定。

这就是 eval 的价值。分数表只是表面结果,最有用的是提前暴露那些容易被忽略的指令漏洞。

第五步:部署到 Agent Runtime

评估过后,就可以让 coding agent 处理部署:


    
    
    
  Deploy this to Agent Runtime in us-central1.

agents-cli 会把项目补齐为 Agent Runtime 可部署的形态,加入入口文件和基础设施配置。根据这次测试,部署到 Google Cloud 大概花了 2 到 3 分钟。

Cloud Trace 默认接入,这一点对团队协作很实用。 Agent 出问题时,不能只看聊天记录,还要能回到 trace 、日志、调用链里定位是哪一步坏了。

第六步:注册到 Gemini Enterprise

很多内部 Agent 做完后,只停留在“某个同事机器上能跑”。别人不知道它存在,也拿不到 endpoint 、权限和使用方式。这样的 Agent 很快就会被遗忘。

继续让 coding agent 执行:


    
    
    
  Register this agent to Gemini Enterprise.

注册后,它会出现在 Gemini Enterprise app 里,组织内有权限的人可以发现和使用。 IAM 控制访问,企业面板负责观测。到这一步,一个 RAG Agent 才从个人 demo 变成团队可用的内部知识助手。

可以怎么用在自己的项目里

如果只是想试水,不用一上来就做复杂 Agent 。更稳的路径是:

  1. 1. 先选一个低风险知识库,比如团队 FAQ 、产品术语表、内部 onboarding 文档。
  2. 2. 用 agents-cli scaffold 或 setup 后的 coding agent 建一个 RAG 项目。
  3. 3. 写 15 到 30 个真实问题,里面故意混入资料不足、歧义、多跳问题。
  4. 4. 先跑 eval,再改 instruction,不要只靠手感调 prompt 。
  5. 5. 本地测过后再部署,部署后补 trace 、权限、成本监控。
  6. 6. 最后再考虑注册到企业入口,让团队成员能找到它。

GitHub README 里列出的常用命令也值得保存:


    
    
    
  agents-cli scaffold 
agents-cli eval generate
agents-cli eval grade
agents-cli deploy
agents-cli publish gemini-enterprise

如果你已经有一个 ADK 项目,也可以用:


    
    
    
  agents-cli scaffold enhance

它会给旧项目补部署、 CI/CD 或 RAG 相关能力。

使用前要先想清楚的地方

agents-cli 很适合 Google Cloud 和 ADK 体系内的 Agent 工程。如果你的团队已经在用 Vertex AI 、 Cloud Run 、 Gemini Enterprise,它能省掉不少胶水工作。

但它也带来一个前提:部署、观测、企业注册这些能力都和 Google Cloud 绑定得比较深。个人开发者可以本地玩起来,真要走云端和企业入口,还是要处理账号、计费、权限、服务条款和区域合规。

另一个提醒是,不要把“coding agent 能自动跑完整流程”理解成可以少做验收。脚手架能加速,eval 和权限检查不能省。 Agent 最危险的地方往往不在答不上来,而在资料不足时答得太顺。

我会怎么判断它值不值得用

如果你的 Agent 还停留在玩具 demo 阶段,agents-cli 可能显得有点重。直接用 ADK 或 LangGraph 写一个本地原型,反而更快。

如果你已经遇到这些问题,它就值得试:

  • • 每个 Agent 都要重新搭项目结构;
  • • 评估集总是上线前才想起来;
  • • 部署脚本、权限、 Cloud Run 配置反复复制;
  • • 内部 Agent 做完后没人知道入口在哪里;
  • • 团队希望 coding agent 不只写代码,还能按工程规范把项目推到可上线状态。

Agent 开发接下来拼的不会只是模型调用能力。更麻烦的部分在评估、权限、部署、观测、组织分发。 Google 这次把这些环节塞进一个 CLI 和一组 skills 里,方向是对的:让 coding agent 少当“会写代码的助手”,多承担一点工程交付的脏活。

来源链接: https://github.com/google/agents-cli                      

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅