微信扫码
添加专属顾问
Anthropic团队揭秘Claude Code开发历程:工具设计的艺术决定了智能体的上限。 核心内容: 1. 智能体工具设计的核心挑战与视角转换 2. Claude Code开发中提问功能的演进故事 3. "AskUserQuestion"工具的设计哲学与实现优势
在智能体(AI Agent)的开发浪潮中,人们总把目光聚焦在模型本身的智商上,却往往忽略了一个决定成败的关键——工具。构建一个高效的智能体框架,最难啃的骨头往往不是提示词工程,而是工具的设计。
换句话说,你究竟给了你的 AI 一双什么样的“手”和“脚”去改变世界?
面对 bash、skills、代码执行这些五花八门的原始能力,到底该如何组合?是给智能体一套全能工具,还是为每个场景量身打造一件专用工具?当工具数量从 1 个增长到 50 个时,复杂度又会怎样变化?
Anthropic团队在开发Claude Code时,也遇到了同样的难题。他们从一次次尝试中总结出一套思路,不是死板的规则,而是一种独特的视角转换——学会像智能体一样看世界(Seeing like an Agent)。
从“给什么用什么”到“用什么给什么”
如果要解决一道复杂的数学题,你会想要什么工具?
纸笔是基础,但受限于手动计算的效率
计算器能提高效率,但需要掌握高级功能的使用方法
电脑是最强大的工具,但需要具备编程能力
工具的价值不取决于其功能的强大,而取决于使用者是否有能力驾驭它,也就是说工具必须与模型的能力相匹配。如果工具超出了模型的理解范围,再强大的功能也是累赘;如果工具过于简陋,则限制了模型的发挥。
在构建 Claude Code 的过程中,Anthropic团队通过具体的演进故事,诠释了这一核心理念。
一. 学会提问
Claude Code的开发者们很早就意识到,智能体需要能够主动向用户提问。比如,当它不确定该用什么方案时,如果能问一句“你更倾向A还是B?”,就能避免后面走错方向。
但问题来了,怎么让提问这件事变得高效?
尝试一:修改 ExitPlanTool
一开始,他们尝试在某个已有的工具(ExitPlanTool)里加一个提问功能。这个工具本来是用来提交执行计划的,现在让它同时带上几个问题。结果智能体犯晕了,它搞不清自己到底是在提交计划还是在问问题,用户回答后该怎么衔接也不明确。这条路显然走不通。
这个方案暴露了一个关键问题:在一个工具中塞入太多职责,会让模型难以理解调用时机和逻辑。
尝试二:修改输出格式
第二次尝试,他们试着直接改输出格式。让智能体在回复时,按某种固定格式写出问题,然后由界面解析出来呈现给用户。这个想法很灵活,但智能体并不总是听话,有时会多写几句无关的话,有时会漏掉某个选项,有时干脆换了格式。
依赖模型自发遵守一种特定格式,本质上是一种赌博。结果不稳定,也不行。
尝试三:AskUserQuestion 工具
最后,他们专门做了一个叫“AskUserQuestion”的工具。这个工具干一件事:提问。智能体可以在任何时刻调用它,尤其是在计划模式下,会专门提示它使用这个工具。工具触发时,系统会弹出一个专门的窗口,列出问题并暂停运行,等用户回答完才继续。
这个设计好在哪?它给了智能体一个清晰的结构,问题要列清楚,选项要给明白。更重要的是,智能体“喜欢”调用它。当一个工具符合模型的思维直觉时,它的表现才会最出色。
这也说明,工具好不好,不是看它功能多强,而是看智能体能不能用对、用顺手。
二、工具也要与时俱进
Claude Code刚上线的时候,团队发现一个现象:智能体做着做着就容易跑偏,忘了自己原本要干什么。
于是他们给智能体加了一个待办清单工具(TodoWrite)。让它一开始就列好清单,做完一项勾一项。但即使这样,Claude 仍会忘记目标。于是又额外加了一个提醒机制:每 5 轮对话插入一次系统提醒。
这套方案在初期管用。但随着智能体模型版本的升级(从Claude 3.5到Opus 4.5),开发者们发现情况变了。
新版本的智能体更聪明了,不再需要频繁提醒。更关键的是,那些提醒反而成了束缚,它会让智能体觉得必须死守清单,不敢根据实际情况灵活调整。同时,当智能体学会调用子智能体(多个小助手协同工作)时,待办清单这种单线程的工具也不够用了。多个子智能体怎么共享一个清单?谁负责更新?谁来协调?
曾经帮助模型的工具,现在反而成为了束缚。
于是他们把待办清单换成了任务工具(Task Tool)。与专注于让模型保持正轨的待办清单不同,任务工具更关注帮助子代理之间相互通信,可以跨子智能体同步状态,智能体也可以随时修改或删除任务。
智能体的能力在进步,过去必需的“拐杖”,今天可能就成了“镣铐”。 工具设计不是一劳永逸的,需要跟着模型一起成长。
三、从喂到嘴边到自主觅食
早期版本的Claude Code,用了一种叫RAG的技术来帮智能体获取代码库信息。简单说,就是把代码库提前做好索引,智能体需要什么,就从索引里把相关内容喂给它。
虽然 RAG 强大快速,但需要索引和配置,在不同环境中容易出问题。更重要的是,整个过程中,智能体是被投喂的,而不是自己去找的。它并不真正理解怎么在代码库里定位信息,也学不会自己去探索。
后来他们换了个思路,如果智能体能上网搜索,为什么不能让它搜索自己的代码库?于是他们给智能体加了一个Grep工具,让它能用关键词在代码库里搜索文件、查找内容。
这一改,效果完全不同了。智能体开始自己尝试搜索关键词、筛选结果、定位相关文件……在这个过程中,它越来越擅长自己构建上下文。
再后来,团队引入了技能(Skill)的概念,进一步把这种能力系统化了。每个技能本质上是一个说明书,智能体可以读取说明书,说明书里又可能指向其他文件,智能体可以一层层往下找。就像一个会查资料的人,先翻目录,再翻章节,最后找到需要的那一段。
今天,Claude Code已经能够跨多层文件递归搜索,精准找到自己需要的信息。而这一切,只是因为它被赋予了自己去找的能力,而不是只等着被投喂。
这种设计思路,后来被他们总结为渐进式披露,不让智能体一开始就面对海量信息,而是给它一个入口,让它一步步探索出自己真正需要的内容。
四、渐进式披露:不加工具,也能扩展能力
Claude Code目前有大约20个工具。团队对加新工具这件事非常谨慎,因为每多一个工具,智能体在做选择时就要多考虑一个选项,选项太多,反而容易出错。
有一次,他们发现Claude Code对自身功能不够了解。用户问“怎么配置MCP”或“某个快捷命令是什么意思”,智能体答不上来。
按理说,最简单的办法是把所有功能说明都塞进系统提示里。但这么做有两个问题:一是大部分用户根本不会问这些问题,塞进去纯属浪费上下文;二是系统提示里塞了太多无关信息,反而会影响智能体在写代码这个主要任务上的表现。
那怎么办?他们又用上了渐进式披露的思路。
他们先给智能体一个指向官方文档的链接,让它自己去查,但效果不太理想。智能体经常一口气加载好几页文档进上下文,就为了找一个几句话就能说清的答案。
于是他们专门做了一个“Claude Code Guide”子智能体。当用户问到关于Claude Code自身的问题时,主智能体就把这件事交给这个子智能体去处理。子智能体有专门的指令,教它如何高效地查文档、如何筛选信息、如何简洁地回复。
虽然还不够完美(Claude 仍然会在自我配置问题上感到困惑),但已经比过去好多了。关键是在不增加工具的前提下,扩展了 Claude 的行动空间。
小结
工具设计这件事,很大程度上取决于你在用哪个模型、想让智能体做什么事、它在什么环境里运行。不同模型的理解能力不一样,同一个工具在这个模型上表现很好,换个模型可能就水土不服。
开发者们能做的,就是不断尝试、仔细观察、反复调整。看智能体的输出,看它怎么使用工具,看它在哪里卡住,然后一点一点优化。
说到底,设计智能体的工具,与其说是一门科学,不如说是一门手艺。手艺的精进,靠的不是背诵规则,而是反复练习、用心观察。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-03
开发者转向 AI 应用工程,真正要迁移的是工程判断力
2026-07-02
不改一行代码,看透 AI Agent 的每一次调用
2026-07-02
AI 不缺智商缺纪律:一场 Harness 工程化实践
2026-07-02
天工 3.2 重磅升级:Skywork Tags 上线,给 Agent 一张工牌,邀其加入你的工作群聊
2026-07-02
Context Infra 会是 AI 领域的下一个热点
2026-07-01
一文了解|SkillScan 智能体技能安全扫描最佳实践
2026-07-01
协作的逆向演进:从 Agent 逻辑重构团队管理
2026-07-01
港科大郭毅可谈Agentic AI时代的核心命题:人机共生,人不可能退场
2026-04-15
2026-04-07
2026-04-07
2026-04-24
2026-04-17
2026-04-05
2026-04-05
2026-04-14
2026-04-24
2026-04-22
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。