微信扫码
添加专属顾问
我要投稿
Anthropic揭秘多智能体系统构建之道,与GPT-5架构设计异曲同工,为AI研究提供新思路。 核心内容: 1. 多智能体系统的核心概念与架构设计 2. 相比单智能体的独特优势与应用场景 3. 实际研究中的挑战与解决方案
智能体系统由多个智能体(LLM 在循环中自主使用工具)协同工作组成。我们的研究功能涉及一个智能体,该智能体根据用户查询规划研究过程,然后使用工具创建同时搜索信息的并行智能体。具有多个智能体的系统在智能体协调、评估和可靠性方面带来了新的挑战。其核心就在于:研究任务通常是开放式的,难以预先确定步骤,具有动态性和路径依赖性。单一智能体受限于上下文窗口和顺序处理能力,无法高效应对复杂查询。
2.什么是多智能体系统的优势
首先,调研工作涉及到的往往是一些开放式的问题,且事先很难预料必须的步骤。你无法对探索复杂主题的固定路径进行硬编码,因为该过程本质上是动态的且依赖于路径。当人们进行研究时,他们倾向于根据发现不断更新他们的方法,跟踪调查过程中出现的线索。随着调查的展开,研究需要灵活地调整或探索切线联系。该模型必须自主运行多个回合,根据中间发现决定追求哪个方向。线性的一次性管道无法处理这些任务。这种不可预测性使得人工智能智能体特别适合研究任务。
搜索的本质是压缩,即从庞大的语料库中提炼见解。子智能体通过并行操作它们自己的上下文窗口,在为主研究智能体凝聚最重要的信息之前,同时探求问题的不同方面,来促进压缩。每个子智能体还提供关注点分离(不同的工具、提示词和探索轨迹),从而减少路径依赖性并实现彻底、独立的调查。一旦智能达到阈值,多智能体系统就成为扩展性能的重要方式。例如,尽管个体人类在过去的10万年里变得更加聪明,但由于我们的集体智慧和协调能力,人类社会在信息时代的能力成倍增加。Anthropic发现,在他们的内部研究评估中,以 Claude Opus 4 为主智能体和 Claude Sonnet 4 子智能体的多智能体系统的性能比单智能体 Claude Opus 4 高出 90.2%。
在实践中,这些架构会快速销毁Token。在我们的数据中,智能体通常比聊天交互多使用约4× 个token,多智能体系统比聊天多使用约 15× 个Token。 一些要求所有智能体共享相同上下文或涉及智能体之间许多依赖关系的域不适合当今的多智能体系统。例如,大多数编码任务涉及的真正可并行化任务比研究少,而且 LLM 智能体还不擅长实时协调和委派给其他智能体。我们发现,多智能体系统擅长处理涉及大量并行化、超出单个上下文窗口的信息以及与众多复杂工具交互的任务。
4.系统架构:编排者-工作者模式
扩展思维&交错思维
:扩展思维(Extended Thinking):是指Claude在生成回答之前,通过更长时间的内部推理过程来分析问题,逐步分解复杂任务,探索多种可能性,并整合信息以生成更准确、全面的回答。这种机制类似于人类在面对复杂问题时进行“深度思考”的过程。
: 交错思维(Interleaved Thinking)是指Claude在生成回答的过程中,将推理步骤与输出内容交织在一起,边思考边生成答案。这种方式更接近于“边说边想”的对话模式,允许模型在输出过程中动态调整推理方向。
5.关键技术与挑战
6.评估与生产部署
7.经验教训与未来展望
8.总结
Anthropic的多智能体研究系统通过主智能体与子智能体的协作,突破了单智能体在复杂研究任务中的局限。其成功依赖于精心设计的架构、提示工程、工具集成和评估策略,但高计算成本使其更适合高价值任务。文章为开发类似系统提供了宝贵经验,强调协调、动态适应和可靠性在多智能体AI中的重要性。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-30
大模型的“思维链”(Chain-of-Thought):AI 是怎么一步步“推理”的
2025-08-30
Agentic AI与WorkFlow的相互成就
2025-08-29
刚刚,xAI 发布 Grok Code Fast 1 编程模型,快、便宜、免费
2025-08-29
大模型时代有了自己的「价值高速公路」
2025-08-29
A I智能革命——上下文工程新突破
2025-08-29
知识库检索准不准,关键看模型选没选对!一份评测指南请收好
2025-08-29
我如何用Prompt工程将大模型调教成风控专家
2025-08-29
度小满金融大模型技术创新与应用探索
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-06-07
2025-06-12
2025-06-19
2025-06-13
2025-07-29
2025-06-15
2025-08-28
2025-08-28
2025-08-28
2025-08-28
2025-08-27
2025-08-26
2025-08-25
2025-08-25