微信扫码
添加专属顾问
Anthropic揭秘多智能体系统架构设计,从工程实践角度解析AI协作新范式。 核心内容: 1. Orchestrator-Worker架构模式解析与分工逻辑 2. 多智能体系统相比RAG的动态优势与交互流程 3. Anthropic总结的8条提示工程核心实践经验
从ChatGPT时代到现在,大家逐渐达成共识:大模型的应用核心不是算法问题,而是工程问题。大模型本身作为基础设施已经就位,关键在于如何通过工程手段解决记忆存储、上下文管理、工具调用和提示词优化等实际问题。
最近读了Anthropic关于多智能体系统的工程实践, 感觉很有意思,所以分享出来。这一篇将解析:
下一篇写Anthropic的智能体评估、生产可靠性和工程挑战。
Anthropic采用orchestrator-worker架构模式。
在AI的论文中经常可以看见orchestrate这个单词。orchestrator的本义是是管弦乐的编曲者,是把一首乐曲改编成适合管弦乐队演奏、并为每种乐器分配合适声部和旋律的人。
在这里orchestrator 引申为“负责总体调度、协调、编排所有子任务的组件,又叫lead agent(主智能体)。 worker是执行子任务的智能体,又叫subagent(子智能体)。
主智能体作为系统的"指挥中心",其核心职责包括:
子智能体则专注于执行特定子任务,彼此并行工作,通过分工协作提升系统整体效率。
下面是研究系统的架构图。
(图源于Anthropic官网)
如图所示,当用户提交查询时,主智能体会进行分析,制定策略,通过子智能体迭代使用搜索工具收集信息,然后将信息返回给主智能体,最后汇总成最终答案。
多智能体与RAG的不同:
检索增强生成 (RAG) 一种静态检索,它们会获取与输入查询最相似的一组词块,并使用这些词块生成响应。而多智能体架构采用多步骤搜索,可以动态地查找相关信息,适应新的发现,并分析结果以生成高质量的答案。
下面是多智能体系统的交互流程,这里可以看出,除了不同的智能体、还有Memory模块和Citation Agent。
(图源于Anthropic官网)
步骤如下:
值得一提的是,这里说到Interleaved thinking 是指交错思考。
Claude 4 模型在调用工具(tool calls)时,不把“思考过程”一次性打包完,而是在每次得到工具返回结果之后,再插入一段新的思考(reasoning),然后再决定下一步要不要继续调用工具、调用哪一个工具。
整个“思考—调用工具—再思考—再调用……”的流程像齿轮交错一样穿插进行,而不是传统的“先一口气想好所有步骤,再连续执行”。
因为研究工作主要涉及开放性的问题,研究者会根据在研究过程中出现的线索,持续更新自己的研究方法。
研究工作的不确定性刚好和AI Agent的特性匹配。AI Agent可以做到自主运行多轮,并根据中间发现决定后续方向。
这样复杂的任务又意味着线性的、一次性的Single Agent 无法处理,必须是Multi Agent协同工作。
多智能体研究系统尤其擅长处理同时涉及多个独立方向的广度优先查询。
主智能体下发任务,子智能体通过与各自的上下文窗口并行运行,同时探索问题的不同方面,提炼每个部分的最重要的信息。
每个子智能体的关注点不相同,他们有不同的工具、提示和探索轨迹,从而减少路径依赖,并支持进行彻底、独立的研究。
缺点是token消耗的很快。Agent使用的token数量是chat 的4倍,Multi Agent使用的token数量是chat 的15倍。
因此,multi agent适合高价值的任务,适合并行任务,multi agent不适合有流程编排的任务,因为它成本巨大。相比研究工作来说,编码工作的并行任务就比较少。
系统性能主要取决于三大要素:
上面的结论是Anthropic使用OpenAI提出的BrowseComp基准进行评估得出来的。BrowseComp是一个用来评估AI Agent查找困难信息的能力的基准。
多智能体系统与单智能体系统的关键区别是协调复杂性的快速增长。
早期的智能体会犯一些错误:
注意,上面这些问题,都是纯靠提示工程优化来解决的哦。提示工程远远比想象中还要重要。
在Anthropic的多智能体系统里,每一个智能体都有一个提示引导。
Anthropic总结了以下8条经验:
站在智能体的角度思考。Think like your agents.
**要迭代提示,必须了解其效果。**有效的提示工程,取决于使用者是否能在脑子里建立对 Agent 的“精确预期模型”;一旦预期有了,最该改什么、怎么改,往往就一目了。
教会主智能体如何分发任务。Teach the orchestrator how to delegate.
在多智能体系统中中,主智能体将查询分解为子任务,并将它们描述给子智能体。
主智能体写的任务说明书必须包含四件套:
• objective——到底要产出什么结论或数据
• output format——以什么格式交卷(表格、段落、JSON …)
• tools & sources——能用哪些工具、查哪些库/网站
• task boundaries——责任边界,防止“三不管地带”或“抢地盘”
如果说明书太简陋,就会出现三类问题:
• 重复劳动(duplicate work)
• 遗漏信息(leave gaps)
• 找不到关键资料(fail to find necessary information)
Anthropic发现,简单、简短的指示是行不通的,例如给出“研究半导体短缺问题”的指示,这些指示非常模糊,以至于子智能体会误解任务,或者执行与其他代理完全相同的搜索。
根据查询复杂度调整工作量。 Scale effort to query complexity.
智能体难以判断不同任务的合理工作量,因此Anthropic在提示中写了scaling rules。
这个scaling rules 有两个好处:让班长智能体高效地分配资源;避免在简单查询上投入过多资源。
工具的设计和选择至关重要。Tool design and selection are critical.
很多人在设计工具的时候经常忽视两点,一是代理跟工具之间的“接口体验”,这相当于人跟软件的 UI/UX。对人来说按钮看不懂会点错;对代理来说 schema 不清、描述含糊就调错。选错工具不仅低效,而且常常意味着任务从根上失败。
二是工具的定义不清晰。例如MCP(Model-Context-Protocol)服务器可能一次性把几十个外部工具塞进代理视野,其中很多工具彼此重叠或描述质量参差不齐。
工具本身的设计(功能边界、输入输出格式)和“选哪个工具”这两个决策点,直接决定智能体能否完成任务。
对此,Anthropic采取的策略是:
• 先扫一遍所有可用工具,整体心里有数
• 把工具能力与用户意图做匹配(intent → tool mapping)
• 需要广泛外部信息时才用通用 web search
• 能用专用工具就不用通用工具(specialized > generic)
Anthropic对工具描述规定了“三有”:
• 有独特定位:功能不跟别人撞车
• 有清晰描述:一句话就能让代理明白“什么时候该用它”
• 有明确边界:输入需要什么、输出给什么、不能干什么
让智能体自我提升。Let agents improve themselves.
让智能体自己发现问题 → 自己出改进方案 → 自己验证效果。
Anthropic写了一个 Tool-testing agent(工具打磨智能体),是这么用的:
这个工具带来了性能的提升:新版工具描述上线后,后续代理使用该工具的任务完成时间下降 40%;因为常见坑点已被前置说明,智能体不再踩雷。
搜索策略的第一步是“宽”,第二步才是“深”。Start wide, then narrow down.
智能体的问题:query由又长又专业的词组合而成,结果找出的信息有限。
改进做法:
这个思路是仿人类的做法:人类专家查资料时,总是先看“这片领域有什么”,再决定“哪个点值得深挖”;智能体也应照做。
指导思考过程。Guide the thinking process.
拓展思考和交错思考进行。
并行工具调用提升了速度和性能。 Parallel tool calling transforms speed and performance.
复杂的研究任务自然需要探索众多来源,但是串行会使任务执行得非常漫长。
为了提高速度,Anthropic引入了两种并行化方式:(1) 主智能体并行启动 3-5 个子智能体;(2) 子智能体并行使用 3 个或以上工具。这些改进将复杂查询的研究时间缩短了高达 90%。
Anthropic的这套提示词是启发式的,也就是说来源于人类的经验,而不是定死的规则。
我觉得他们的工程做得很细致。他们研究了专家如何处理研究任务,并将这些策略融入到提示中——例如根据新信息调整搜索方法,以及识别何时关注深度(详细研究一个主题)而非广度(并行探索多个主题)。
他们还通过Tool-testing agent进行自我迭代,同时为每个智能体设置提示词,制定了一些标准防止智能体失控。不过考虑到token的巨大消耗,还需要在成本控制、错误预防和流程优化等方面持续改进。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-30
LangAlpha是如何在架构上实现Harness 和 Loop Engineering
2026-06-30
Codex 权限 Profile:sandbox 不再一刀切
2026-06-30
Google 悄悄开闸:Gemini API 免费放量 1M TPM,OpenAI 和 Anthropic 开发者坐不住了
2026-06-30
我的Mac潜伏了一个月木马:AI Agent时代,真正危险的不是“手滑”
2026-06-30
AgentOps:用户快速地调教好你的Agent的关键功能。
2026-06-30
AI 应用产品评测体系完整指南
2026-06-30
AI写代码越快,程序员越危险?Codex负责人摊牌:真正难的是"删代码"
2026-06-29
17 岁高中生做了个假 AI,上线一个月获 2.8 亿次访问
2026-04-15
2026-04-07
2026-04-07
2026-04-24
2026-04-17
2026-04-05
2026-04-02
2026-04-05
2026-04-14
2026-04-24
2026-06-27
2026-06-26
2026-06-25
2026-06-18
2026-06-18
2026-06-10
2026-06-10
2026-06-07
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。