2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

理解基于LLM的Agent及多Agent架构

发布日期:2024-07-26 19:42:03 浏览次数: 3653
作者:Tech For Fun

微信搜一搜,关注“Tech For Fun”

理解基于LLM的Agent及多Agent架构

当今时代,大型语言模型(LLM)已成为一种强大的主体,能够以惊人的准确性和流畅性处理和生成类似人类的文本。然而,这些模型的潜力不仅限于内容生成,它们还可以作为多Agent 系统中的智能体加以利用,为协作解决问题、动态交互和复杂决策铺平道路。在本文中,我们将首先了解什么是基于 LLM 的 Agent ,它的优势以及一个用例。然后,我们将转向基于 LLM 的多 Agent 系统--什么是多 Agent 系统、多 Agent 系统的优势、类型以及使用实例的特点。

什么是基于 LLM 的Agent?

Agent 是一个自主单元,通过编程可以执行任务、做出决策并与环境通信。

同样,基于 LLM 的 Agent 是一个高级单元,它将 LLM 作为大脑来进行思考、做出决策并采取行动完成特定任务。这些 Agent 还可以拥有记忆,可以是短期记忆( Agent 的思路),也可以是长期记忆(对话历史)。它们还可以使用工具来执行任务,如上网搜索、使用计算器等。

让我们看看下面的示例--如果用户的天气条件不理想(如大雨、极端温度或大风),则以电子邮件的形式向用户发送个性化提示。例如:如果有可能下大雨,Agent 的建议可以包括携带雨伞;如果天气非常炎热,Agent 的建议可以包括穿浅色衣服等。

但是,它们无法访问外部环境,只能依赖于经过训练的信息。对于我们当前的例子来说,我们需要编写一些额外的代码来获取天气信息,然后使用 LLM 生成电子邮件内容。

这就是 Agent 的作用。它们可以与外部世界交互,获取信息,然后使用 LLM 生成内容。

要了解更多信息,请看下图:

气象咨询 Agent 架构

因此,我们的基于 LLM 的 Agent 将首先尝试获取用户的当前位置,以查找天气状况。因此,它将使用提供给它的工具来获取位置。获得位置后, Agent 将使用另一个工具从天气 API 获取当天的天气预报。根据天气预报和内存中前一天的预报,它将判断是否是突发天气情况。如果是,它就会根据天气情况为用户生成个性化的提示,并使用工具向用户发送电子邮件。

结合我们目前所学到的知识,我们可以列出使用 Agent 的优势如下:

  1. 执行专业化的复杂任务 - 通过集成工具, Agent 可以执行诸如调用应用程序接口、使用数学工具进行复杂计算等任务。
  2. 实时和动态交互 -  Agent 可以与外部世界交互,并通过在线搜索、应用程序接口等获取实时数据。这使他们能够向用户提供动态回复。
  3. 提高准确性和可靠性--LLM 可能会提供一个笼统的答案,也可能在发送前不进行推理,但 Agent 可以确保其答案的准确性,因为他们会按照思路分步执行任务。

基于 LLM 的多 Agent 系统

在了解了基于 LLM 的单个 Agent 之后,让我们深入了解基于 LLM 的多 Agent 系统。基于 LLM 的多 Agent 系统由多个 Agent 组成,它们共同工作以实现一个共同目标。系统中的每个 Agent 都有特定的角色,专门执行特定的任务。多 Agent 系统背后的理念是团队合作意识。每个具有不同角色和背景的 Agent 都可以从不同的角度出发,为实现共同目标而合作。综上所述,使用基于 LLM 的多 Agent 系统有以下好处:

  1. 单一责任原则--每个 Agent 都有特定的角色,负责执行特定的任务。这可确保每个 Agent 都专注于自己的任务并出色完成。
  2. 分解复杂任务 - 可以将复杂任务分解成更小的任务,并分配给不同的 Agent 。这使得管理和执行复杂任务变得更加容易。
  3. 增强协作 -  Agent 可以相互沟通并共享信息。这使他们能够协同工作,实现共同目标。
  4. 可扩展性 - 通过添加更多的 Agent 来执行额外的任务,系统可以很容易地进行扩展。这使得系统很容易适应不断变化的需求,并根据需要进行扩展。
  5. 容错 - 如果一个 Agent 未能提供预期输出,下一个 Agent 有可能会要求前一个 Agent 再次运行以生成答案。因此,系统具有容错性。此外,如果需要,它们还可以将任务委托给另一个 Agent 。
  6. 增强性能 -  Agent 可并行执行任务。这可以加快任务执行速度,提高系统性能。
  7. 可重用性 -  Agent 可在不同的系统中重用,以执行类似的任务。这使得重用现有 Agent 和快速构建新系统变得非常容易。

让我们来看一个实际用例,在这个用例中,这可能会有所帮助。

创建一个系统,在博客平台上发布一篇关于给定主题的文章。让我们将问题陈述分解成更小的任务,并思考如何使用基于 LLM 的多 Agent 系统来解决这个问题。

  • 第一部分是获取关于给定主题的内容。我们可以让一个 Agent 从互联网上的不同来源获取信息并进行编译。
  • 第二部分是撰写文章。
  • 第三部分是验证文章是否适合发布,例如检查抄袭、语法等,然后发布。

因此,我们的系统中有三个 Agent --研究 Agent 、写作 Agent 和发布 Agent。每个 Agent 都有特定的角色,负责执行特定的任务。请看下图,以便更好地理解:

在博客平台上发表文章的基于 LLM 的多 Agent 架构
  • 我们可以看到,所有三个 Agent 都获得了专门针对其任务的工具。所有 Agent 都被赋予了适当的角色、目标和背景,并使用了 Prompt Engineering 技能,以获得高质量的结果。
  • 如果第二个 Agent 发现对该主题所做的研究不足以撰写文章,它会再次要求第一个 Agent 提供更多信息。同样,如果第三个 Agent 发现所撰写的文章不适合发表,它就会回到第二个 Agent 那里,对文章提出反馈意见,并要求其重新撰写。这样,我们就有了一个更可靠、更高效的系统。
  • 这里讨论的多 Agent 系统类型是顺序型。顺序式流程确保任务一个接一个地按照线性顺序执行。
  • 另一种多 Agent 系统是分级式。在我们当前的示例中,如果在三个 Agent 的上方都有一个经理,他负责协调工作流程、委派任务并验证每个 Agent 的成果以确保质量,那么这就成为了一个分级系统。请看下图,以便更好地理解

基于分层 LLM 的多 Agent 框架

多 Agent 系统中的人工干预

在某些情况下,可能需要人工干预。例如:在我们当前的使用案例中,发布者 Agent 在完成所有检查后,可以要求人工再次确认文章是否可以发布。这就是 "人类在循环中(human in loops)" 概念的由来。人类在循环中指的是人类参与系统的决策过程。 因此,我们可以通过给出版 Agent 提供一个工具,让它能够在对文章不确定时请求人工干预。我们可以在提示中明确指出,当我们需要人工干预时, Agent 只能在需要时请求人工干预。

人类在基于 LLM 的多 Agent 架构的循环中

结论

选择独立的 LLM 或基于 LLM 的 Agent ,还是基于 LLM 的多 Agent 系统,取决于任务的复杂性和系统的要求。此外,在选择方法时,我们还可以考虑系统的响应时间、准确性和可靠性。与基于 LLM 的 Agent 和基于 LLM 的多 Agent 系统相比,独立 LLM 的响应时间较短。不过,与独立 LLM 相比,基于 LLM 的 Agent 和基于 LLM 的多 Agent 系统的系统准确性和可靠性更高。

- END -


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅