傻傻分不清？一文彻底说清Agentic RAG的前世今生！

发布日期：2024-12-13 11:31:27 浏览次数： 4223

作者：AI大模型应用实践

微信搜一搜，关注“AI大模型应用实践”

生成式AI的发展日新月异，一不小心你就会淹没在新的概念中。RAG（检索增强生成）、Agent（智能体）作为主流的大语言模型（LLM）应用形式已经广为人知。这不还经常听到一个词：Agentic RAG，前两天还有人问小编它到底是RAG还是Agent？今天我们就来彻底说清楚Agentic RAG。

为什么需要Agentic RAG？

首先，RAG是什么？RAG是用检索到的外部知识来对LLM进行能力增强的一种技术，旨在降低LLM的幻觉并让其更好的适应特定领域内的应用场景。通俗的讲：RAG就是给LLM增加一个可快速查询的“外挂”知识库，增强其能力，以防它不懂的时候胡说八道。

RAG = LLM + 知识库 + 检索器

它可以让AI准确的回答诸如这样的问题：

公司的财务报销审核流程是怎样的？
上半年销售业绩前三名代理商是谁？
总结公司最新财报中的关键要点？

经典的RAG流程是借助检索器从知识库中查询问题相关（语义接近）的内容，并把这些内容作为LLM回答的上下文，从而得出最终答案。

现在，让我们考虑以下几个查询场景：

需要能够使用不同的检索技术来应对不同类型的查询问题。如既能回答事实性查询（”xPhone手机详细参数“），也能回答总结性的问题（”总结下这篇论文要点“）
需要融合多个数据源的检索结果给出响应。比如这样的查询：

”查询销量最高的三个代理商的摘要信息及其关联公司“

这里的问题是：

查询销量最高的代理商需要查询CRM系统的数据库
代理商的详细信息存储在非结构化文档中
关联公司的查询需要查询某个知识图谱数据库

单一的RAG检索与生成管道显然无法应对这样的问题。

需要结合外部工具来增强RAG管道的回答能力与响应质量。比如这样一个查询任务：

“对比竞品公司产品与我公司产品，并总结媒体评论”

为了完成这个问题，你需要：

借助本地检索器，查询自身产品信息
借助Web搜索查询竞品信息
借助公开的API查询某些自媒体评论

这样的一个融合性查询任务也是单一RAG管道无法完成的。

希望RAG在检索相关数据后能够自我反思评估，必要时重新检索甚至改写问题。

这些都是在实际应用中可能会面临的需求，经典的RAG方案在面临这些场景时会捉襟见肘，因此更“Agentic”的RAG出现了。

什么是Agentic RAG？

Agentic RAG就是一种融合了Agent能力的RAG，而Agent的核心能力是自主推理与行动。所以Agentic RAG就是将AI智能体的自主规划（如路由、行动步骤、反思等）能力带入到传统的RAG，以适应更加复杂的RAG查询任务。

Agentic RAG如何应对这些典型的复杂任务？一起来看。

在不同类型的RAG管道间自主选择（路由），以适应任务的多样性：

融合多种类型的RAG管道与数据源，以适应综合性复杂查询任务：

与必要的外部工具协作，以增强输出的准确性：

整体来说，Agentic RAG的“智能体”特征主要体现在检索阶段，相对于传统RAG的检索，Agentic RAG更能够：

决定是否需要检索
自主决策使用哪个检索引擎
自主规划使用检索引擎的步骤
评估检索到的上下文，并决定是否重新检索
自行规划是否需要借助外部工具

Agentic RAG VS 传统RAG

Agentic RAG在整体流程上与传统RAG一脉相承：检索-合成上下文-生成，但由于融入了Agent的自主能力，从而具有更强的适应性与任务质量。

这里的传统RAG指遵循“检索-上下文-生成”单一顺序流程的RAG应用。随着开发框架的不断完善，当前一些常用的高级RAG模块已经具备了部分Agentic的特征，比如：语义路由、多步骤查询转换、子问题查询转换等。

	传统单一流程RAG	Agentic RAG
场景	数据环境简单、任务单一	企业级数据环境，任务多样
数据源	通常基于单个检索引擎	通常基于多个检索引擎
索引	向量索引为主	可灵活结合多种索引
检索规划	无规划或静态规则	动态规划下一步检索策略
多步检索	通常不支持	借助多步骤推理自主实现
外部工具	通常不支持	自动推理使用必要的工具
反省机制	通常不支持	借助反省优化问题或重新检索
灵活性	不够灵活，流程固定	自主推理，或灵活编排