我要投稿

RAG不够用了？谷歌推出全新Agentic RAG框架

发布日期：2026-06-08 18:11:15 浏览次数： 1535

作者：模智空间

微信搜一搜，关注“模智空间”

在当下企业数字化办公场景里，AI 问答、智能检索早已不是新鲜事物。可不少企业使用者都有过类似糟心体验：对着 AI 提出一条跨部门、多数据源的复杂问题，得到的答案要么残缺不全、关键信息缺失，要么凭空编造内容，甚至直接回复 “未查询到相关信息”。

传统 RAG（检索增强生成）之所以频频掉链子，核心问题在于它是一套单向运行的固定流程。简单来说，就是用户提问、系统单次检索资料、模型整合内容输出答案，全程不会二次思考、二次溯源。

面对企业里散落于不同数据库、文档库、业务系统的各种数据，这种单步检索模式完全力不从心。举个很典型的例子，当员工询问 “X 项目所用服务器的详细参数”，传统 RAG 或许能检索到项目文档，找到对应的服务器编号，却不会主动拿着编号去另一套设备数据库继续深挖参数，最终只能给出半吊子答案。

过去两年里，大量技术文章围绕这个问题展开讨论，各类优化方案也层出不穷，但始终没能根治核心缺陷：传统 RAG 并非检索不到信息，而是缺乏主动持续检索的能力。

6 月 5 日，Google Research 发了一篇文章《Unlocking dependable responses with Gemini Enterprise Agent Platform’s Agentic RAG》解决的就是这个问题：让 AI 在做答之前，先确认自己搜到的信息够不够，不够就回去继续搜，直到够了为止。下面我们来详细看一下。

谷歌Agentic RAG

先帮大家回忆一下RAG是什么，简单来说，就是让大模型在回答之前，先去指定的知识库里搜一圈，找到相关材料后再组织答案。这个办法确实在很大程度上解决了模型乱编的问题。

但问题在于，传统RAG采用的是单步检索模式：用户提问 → 系统搜一次 → 把搜到的内容塞给模型 → 生成答案。这个模式在简单查询场景下挺好用的。可一旦遇到稍微复杂一点的问题，就开始露怯了。

谷歌Agentic RAG本质上就是给RAG配备了一个调研小组，有规划的、有执行的、有质检的，各司其职：

根智能体负责理解用户的整体需求，然后分派任务给下面的子智能体。
规划智能体负责判断需要去哪些数据库里找信息，是财务系统、项目文档库、资产登记表，还是客户关系管理系统。
查询改写器把用户的话拆解成多个精准、可搜索的子问题。比如“那个项目的服务器规格”，可能会被拆成“项目名称对应的服务器ID”和“该ID对应的规格参数”等多个搜索片段。
搜索扇出智能体同时对着多个数据库发起并发检索，而不是一个个慢慢问。
RAG智能体负责搜集各个片段，拼凑成初步的素材库。

这套流程跑下来，一个需要跨三四个数据库才能回答的复杂问题，系统能一路串联到底，而不是卡在第一步就放弃了。

Sufficient Context Agent

如果说上述设计已经够聪明了，那谷歌这套方案里最核心的其实是Sufficient Context Agent，翻译过来是上下文充分性判断智能体，名字看着有点复杂，但实际做的事情很好理解。也就是在最后生成答案之前，先判定一下当前找到的信息到底够不够用。

具体来说，它会干三件事：

1. 检查检索到的文本片段里，是不是真的涵盖了用户问题的核心诉求。

2. 检查当前拼凑出来的草稿答案，是不是回答了问题里的每一个子问题。

3. 如果发现有缺失，那就不交卷，而是生成一份详细的反馈日志，告诉查询改写器“你还差什么信息”，然后触发第二轮精准搜索。

这就像一条生产线末端的质检员。产品没做完，就是不放行。而且他不是简单地喊不行重来，而是明确告诉你具体的需求，让上游知道到底该怎么补。

这套闭环机制会反复迭代，持续补全遗漏信息，直到所有缺失的事实都找齐之后，才由综合智能体生成最终答案。

这么做带来的最直接的好处就是系统不再硬猜了。

以前很多AI之所以会胡编乱造，不是因为模型本身不行，而是因为检索没找到完整信息，系统又没有停一停再找找的机制，只能硬着头皮往下接。现在有了充分上下文智能体把关，信息不全就直接打回重查，从源头上遏制了幻觉的产生。

谷歌透露，在FramesQA这个专门测试多源多跳查询的数据集上，即使在需要跨4个不同数据库检索的场景中，这套方案依然实现了90.1%的准确率，几乎和单库检索的精度持平。相比标准RAG，在事实性数据集上的准确率最高提升了34%。

以一个具体的医疗场景

光说技术概念可能有点抽象，我们用谷歌官方提供的医疗场景来梳理一遍流程。

假设一位医生问了一个非常具体的患者问题：“xx膝关节手术后的出院用药和饮食限制是什么？住院期间是否出现过过敏反应？不包括仅在住院期间使用的药物，但肝素静脉滴注和替奈普酶除外。”

这个问题涉及三个不同的信息领域：药房系统、营养科记录、临床过敏史记录。

系统接单后，规划智能体迅速识别出需要去三个领域分别搜索。查询改写器把这个问题拆成多个子问题，RAG智能体并行检索。

结果呢？药房和营养科都找到了相关信息，但在最明显的那份病历文件里，完全没有找到过敏反应的记录。

到这里，放在传统RAG系统里，流程就该结束了，药和饮食找到了，过敏没找到，但系统会直接把前两段答案拼凑出来交差，缺了的就是缺了。

但Sufficient Context Agent截住了这个不完整的答案。它发现过敏信息确实缺失了，于是生成反馈：“搜索‘皮疹’或‘不良事件相关记录’。”然后整个循环重来一次，精准补上缺失的信息，最终给到医生一个完整的答案。

小结

谷歌Agentic RAG 的思路简单点说就是让 AI 回答问题时先不急着开口，先去翻资料；翻不到就再去翻关联资料；资料凑不齐就不交卷，直到所有缺口都补上。

这种设计给我们的最大启发其实是：AI 的可信度不是靠模型参数堆出来的，而是靠检索流程的严谨性兜出来的。对于一个普通用户来说，未来你遇到的那些“明明有答案但 AI 就是找不到”的抓狂时刻，会越来越少。对于企业来说，这意味着终于可以放心地把一些需要跨系统查询、多步推理的工作交给 AI 去跑，而不用担心它给你编出一份错漏百出的报告。

说到底，技术再花哨，最终还是要回到那个朴素的问题：你这个答案，敢不敢让我直接拿去用？

而从 Agentic RAG 这套机制来看，我们离那个敢用的时刻，又近了一步。

如果觉得这篇文章有帮助，欢迎点赞、在看、转发。关注模智空间，获取更多 AI 领域技术解读与行业分析。