AI智能体的五个级别

发布日期：2024-07-27 20:37:21 浏览次数： 3255

作者：Tech For Fun

微信搜一搜，关注“Tech For Fun”

介绍

这是我非常喜欢研究的一个话题。主要是因为我想揭开智能体相关概念的神秘面纱，以及智能体究竟是什么。

此外，我还想在特定领域的实现与广泛、通用的实现（即 AGI）之间建立明确的界限。

考虑到特定领域的实现，这是我最感兴趣的领域，这一类需要考虑可用的构建工具、成本、延迟以及实际和商业影响。所有这些，我都将在本文中一一阐述。

领域考虑因素

关于 AGI 或人工超级智能 (ASI) 以及各组织正在开发的产品，已经有很多炒作、恐惧和猜测。这不是我最感兴趣的，我最感兴趣的是如何利用 LLM 和自主AI智能体的力量，在组织中实现特定领域的应用。

对话式用户界面的主要商业驱动力是银行、零售、金融服务等行业的公司，它们创建了基于人工智能的用户界面，供用户就产品和服务进行交互。

任何能够感知环境并执行行动的实体都可以被视为智能体。

目前所处的阶段

考虑到细分领域的实现，我们目前处于第 2 级和第 3 级；最有可能处于 2.5 级。

LangChain 在创建智能体开发框架方面一直处于领先地位。DSPy 使用其智能体 RAG 方法对 LLM 和 LLamaIndex 进行编程。

这些智能体拥有 50% 至 90% 的成人技能，具有战略任务自动化能力。根据用户输入，智能体可以分解用户描述，规划子任务，并以有序的方式执行这些任务，从而得出结论。

这些智能体能够反复执行中间的子任务，直到得出最终答案。

实际案例

考虑以下问题？

谁被认为是 iPhone 之父，他出生年份的平方根是多少？

这是一个相当模糊和复杂的问题，需要经过几个步骤才能得出答案。不仅要完成数学任务，还要检索知识来回答问题。

在这个实际例子中，智能体可以采取以下几种行动：

LLM Math
SerpApi:下面是SerpApi网站的截图。SerpApi 使从搜索引擎结果中提取数据变得可操作。
GPT-4（gpt-4-0314）

下面，请看这个基于 LangChain 的智能体的输出，注意该智能体是如何从思考到行动，再到观察，依次进行，直到得出最终答案，完成整个链条：

在5个等级的智能体表格中，你会注意到 1 级智能体是基于规则的......基于规则的智能体可以有一定的自主性，但在实践中，它们由预定义的步骤组成，这些步骤根据预定义的步骤执行。

下图展示了一种更基于规则的方法，即使用生成式人工智能节点来构建智能体。在本文稍后部分，我将深入探讨为什么基于规则的自动化和一定程度的自主性是企业实施的明智方法。而不是完全自主的智能体方法。

细分领域智能体的基本结构

细分领域智能体的核心是大型语言模型（LLM）。智能体还可以使用一些工具。工具可以具有特定功能，如网络搜索、特定 API、RAG、数学等。

工具用自然语言描述，以便智能体知道在流程的特定阶段使用哪种工具。工具的数量和能力决定了智能体的强大程度。

实际考虑因素

在考虑细分领域的智能体实施时，有一些实际考虑因素需要牢记。

感知

目前，大多数智能体都是虚拟的，通过语音或文本输入进行访问。这些智能体可以进行推理并得出结论，然后反过来用语音或文字做出回应。可以添加多模态元素，让智能体接收图像或视频作为输入，或生成图像或视频作为输出。

不过，一般来说，机器人不具备其他感官能力，如视觉、触觉、运动等。随着机器人技术的发展，将智能体与感官/物理能力相结合将开创一个新时代。

LLM

正如我前面提到的，智能体的核心是一个 LLM，或者更具体地说是一个被调用的 LLM API。智能体会经历多次迭代和 API 调用。需要满足一个单一的依赖关系，因此我认为任何生产智能体的实现冗余都必须构建到智能体核心中。

自托管

LLM 或本地推理服务器是确保正常运行时间的最佳方式。

成本

考虑到向智能体提出的每个问题都要多次查询 LLM，使用商业 LLM API 的成本将非常高昂。

试想一下，成千上万的用户只会加剧成本问题。

延迟

对话系统需要亚秒级的响应，任何复杂的系统（如每次对话都需要在内部执行多个步骤的智能体）都会增加用户体验的总延迟。这可能成为一个难以克服的挑战。

无法得出结论

值得注意的是，目前存在智能体未得出结论或过早得出结论的情况。如果用户可以访问并查看智能体的推理步骤，那么用户的查询可能会通过智能体推理的中间步骤得到满足。在这种情况下，用户可以让智能体停止推理，并告知智能体已经提供了足够的信息。

工具与成本

智能体需要使用工具才能完成任务。可以建立一个共享工具的市场。制作者无需从头开始制作工具，只需选择现有的工具即可。

这些工具可以是免费的，也可以是收费的；工具可以访问收费的应用程序接口。

智能体一词

随着人工智能的发展，"智能体 "一词被用来描述那些表现出智能行为并拥有以下能力的实体：

自主性
反应性
主动性
社会互动等能力

20 世纪 50 年代，艾伦-图灵提出了人工智能领域的一个重要概念--图灵测试，旨在研究机器是否能表现出与人类类似的智能行为。这些人工智能实体通常被称为智能体，是人工智能系统的基础组成部分。

迁移学习

迁移学习涉及利用从一项任务中获得的知识，并将其应用到另一项任务中。

基础模型通常采用这种方法，即首先在相关任务中对模型进行训练，然后针对感兴趣的特定下游任务对模型进行微调。

迁移学习是一个强大的概念，它增加了模型的多功能性，可以根据过去的学习执行从未见过的任务。

结论

不知何故，自主AI智能体目前被忽视了，但它代表着技术的关键进步。

配备人工智能的智能体具有yi'xia以下能力：

独立运行
做出决定
在没有人类持续干预的情况下采取行动

未来，自主AI智能体将彻底改变从医疗保健、金融到制造和运输等各个行业。

然而，在决策过程中还需要考虑问责制、透明度、道德、责任和偏见等问题。

尽管存在这些挑战，自主AI智能体的未来仍大有可为。随着技术的不断发展，这些智能体将越来越多地融入我们的日常生活。

- END -

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-27

大模型问答流程节点设计：从一轮到多轮对话的意图识别

2026-06-21

AI智能体怎么接入你现有的ERP和CRM——系统集成的实操指南

2026-06-03

你的公司需要一个"养Agent的人"，但没人知道这个岗位叫什么

2026-05-18

你的下一位同事，可能是“管 AI 的 AI”

2026-04-29

拦截率从15%到55%：快手智能Oncall系统演进与落地实践

2026-02-11

别再让语音机器人“答非所问”：AI Force任务型语音对话技术总结

2026-01-20

用AI做物业管理与租赁助手，A16Z领投2.5亿美元，这家AI团队年营收超1亿

2026-01-19

熠智AI+Milvus:从Embedding 到数据处理、问题重写，电商AI客服架构怎么搭？

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

拦截率从15%到55%：快手智能Oncall系统演进与落地实践

2026-04-29

你的公司需要一个"养Agent的人"，但没人知道这个岗位叫什么

2026-06-03

你的下一位同事，可能是“管 AI 的 AI”

2026-05-18

AI智能体怎么接入你现有的ERP和CRM——系统集成的实操指南

2026-06-21

大模型问答流程节点设计：从一轮到多轮对话的意图识别

2026-06-27

大家都在问

熠智AI+Milvus:从Embedding 到数据处理、问题重写，电商AI客服架构怎么搭？

2026-01-19

客服领域AI Startup领头羊Sierra凭啥估值100亿美金？

2025-11-22

当 AI 走出会议室：钉钉为什么率先抓住了“多数人的场景”？

2025-11-17

AI都能看片子了，放射科医生为什么却成了香饽饽？

2025-11-10

企业AI智能化建设中，如何处理 “业务优先” 与 “技术优先” 的核心矛盾？

2025-11-02

一键抓取链接、实时更新：AI代理如何从0帮你构建智能客服知识库？

2025-08-27

钉钉这一次能硬起来吗？

2025-08-25

AI+RAG，让“AI销冠”帮我卖货？

2025-08-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw