三个最新RAG前沿思路分解：从Astute RAG减少检索噪声到Retriever-and-Memory自适应检索迭代生成

发布日期：2024-10-17 11:51:02 浏览次数： 3380

作者：老刘说NLP

微信搜一搜，关注“老刘说NLP”

今天是2024年10月17日，星期四，北京，天气阴。

来回顾下昨日大模型早报，社区日常互动，欢迎加入。

我们来看看最近的三个RAG进展，包括Astute RAG、StructRAG、Retriever-and-Memory等几个工作，有些思路很有趣，可看看。

供大家一起参考并思考。

一、Astute RAG减少检索噪声

不太好的检索结果可能引入无关、误导甚至恶意信息；LLMs内部知识与外部知识之间的潜在冲突；如何在RAG的后检索阶段有效解决这些冲突。

对于这类问题，之前已有一些工作，例如提高RAG系统鲁棒性的各种方法，如训练LLMs以应对噪声上下文、过滤无关段落、重排段落、动态和迭代检索、查询重写等。

最近的工作《Astute RAG: Overcoming Imperfect Retrieval Augmentation and Knowledge Conflicts for Large Language Models》(https://arxiv.org/abs/2410.07176)，提到一个自适应的方式，来看看其实现思路：

1、自适应生成内部知识

首先，从LLMs的内部知识中自适应地生成信息，以补充检索到的段落。这部分利用LLM生成与给定问题相关的准确、相关且无幻觉的段落。

为了确保生成的段落具有高可靠性和准确性，ASTUTE RAG提供宪法原则来指导生成过程，强调生成的段落应该是准确的、相关的且无幻觉的。

M表示LLM，pgen是提示模板，q是问题，m^是生成的最大段落数。

此外，LLM可以自行决定生成多少段落，而不是固定数量的段落，这允许LLM在内部知识有限时生成较少的段落，而在有多个可行答案时生成更多段落。

2、源感知的知识整合

其次，将内部和外部知识进行整合。初始时，将检索到的段落和内部生成的段落合并，并为每段提供来源信息。

然后，通过提示LLM识别一致的信息、检测冲突信息并过滤无关信息。

3、答案的最终确定

最后，根据每组一致段落的可靠性生成最终答案。通过比较不同段落组的答案，选择最可靠的一个作为最终答案。

不过，在最坏情况下，ASTUTE RAG的表现接近于无检索增强（No RAG）的情况。

二、StructRAG引入结构化分流处理

现有的RAG方法在处理知识密集型推理任务时面临挑战，因为这些任务所需的信息分散在文档中，导致模型难以准确识别关键信息并进行全局推理。

《StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization》，https://arxiv.org/abs/2410.08815

先说不足，这个工作YY现象很严重，因为在实际场景中很难会说这个东西应该使用来自于哪个数据，这个路由可能本身就不成立，并且还需要针对不同的类型做处理，这个时延性是很难接受的。

由于缺乏用于选择最佳结构类型的偏好数据，虽然设计了一种合成-模拟-判断的方法来构建训练数据。这种方法虽然有效，但在实际应用中可能面临数据质量和多样性的问题。

此外，尽管混合结构路由器在选择最佳结构类型方面表现良好，但原始LLM在没有特殊训练的情况下仍然难以选择最优的知识类型。

最后，使用单一的固定结构类型（如表格、图表、文本块等）在多样化的任务中表现不佳。这验证了混合信息结构化的重要性，但也增加了系统的复杂性。

之后，我们来看看其具体实现细节，StructRAG包括一个混合结构路由器、一个分散知识结构化器和一个结构化知识利用器，其中，混合结构路由器用于根据任务需求选择最优的结构类型；分散知识结构化器：将原始文档转换为所选结构类型的结构化知识；结构化知识利用器：分解复杂问题并使用结构化知识进行答案推断。

1、混合结构路由器

首先，混合结构路由器，用于根据任务需求选择最合适的结构类型。

该路由器利用问题和文档的核心内容来决定最佳结构类型。

其中，q 是问题，C 是文档的核心内容容，t是选择的结构类型。

可以看其具体实现策略：

首先，从文档中提取每篇文档的核心内容，通常是标题或前几个句子。

然后，根据提取的核心内容和问题，混合结构路由器选择最适合的结构类型。结构类型包括表格（用于统计任务）、图表（用于长链任务）、算法（用于规划任务）、目录（用于总结任务）和文本块（用于简单单跳任务）。

此外，为了提高混合结构路由器的选择能力，基于DPO进行训练。

2、分散知识结构化器

其次，使用基于LLM的分散知识结构化器将原始文档转换为结构化知识。

该结构化器利用LLM的理解和生成能力，从文档中提取结构化知识。

其中，q是问题，t是选择的结构类型，d (i)是第i篇文档，kt(i)是提取的结构化知识，bt(i)是结构化知识的描述。

具体实现上，

首先，分散知识结构化器接收问题、选择的结构类型和每篇原始文档作为输入。

其次，利用LLM的强大理解和生成能力，结构化器从文档中提取结构化知识。不同类型的信息（如表格、图表、算法等）需要不同的处理方式。例如，表格可以通过解析Markdown格式生成，图表可以通过提取实体-关系三元组生成，算法可以通过伪代码表示，目录可以通过分层编号表示。这里涉及到不同的文档的结构化处理prompt，简单粗暴：

1）Prompts in Constructing Table

2）Prompts in Constructing Graph

3）Prompts in Constructing Algorithm

4）Prompts in Constructing Catalogue

最后，除了提取结构化知识外，结构化器还会生成结构化知识的描述，以便于后续的利用和推理。

3、结构化知识利用器

最后，使用基于LLM的结构化知识利用器将复杂问题分解为简单的子问题，

并通过结构化知识进行精确的知识提取和最终答案推理。

对应的prompt如下：

三、Retriever-and-Memory自适应检索迭代生成

现有的RAG方法在复杂问答任务中往往无法收集到足够的信息。Adaptive RAG（ARAG）尝试通过自适应地决定“何时何地检索”来捕捉更多有价值的知识，但仍存在一些局限性。

最近的工作《Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation》，http://arxiv.org/pdf/2410.08821v1。

先说存在不足的点：

首先，在自适应过程中，检索次数被限制在15次以内，这可能会影响在某些情况下获取更多有用信息的能力。

其次，虽然实验中使用了默认的参数设置，但自适应记忆审查器的触发条件（如无效更新次数、收集迭代次数和去重检索段落数）可能需要进一步调整以优化性能。

最后，长尾知识的处理，某些查询可能对应于语料库中的大量长尾知识片段，这些片段在多次迭代后可能会增加笔记的信息量，但也可能导致不必要的噪声。

我们再来看看实现细节，可以看其构成模块。

1、迭代信息收集器（IIC）

初始阶段，基于查询和检索到的段落生成初始笔记作为初始记忆。

迭代阶段，利用当前最优记忆和原始查询生成新的查询，并检索新的段落更新笔记。

首先，使用BM25或DPR检索器从语料库中检索与问题相关的段落，并将其作为初始记忆存储在LLM中。

然后，迭代地利用当前记忆和原始问题生成新的查询，并检索新的参考段落，更新记忆。

这几个部分，对应的prompt如下：

2、自适应记忆评审器（AMR）

评估更新后的笔记和当前最优记忆的内容质量，决定是否将更新后的笔记替换为新的最优记忆。同时，设置停止条件以控制信息收集的迭代次数。

涉及到两个子问题：

对于决定存储什么作为最优记忆：AMR通过多维评估当前笔记和最优记忆的内容质量，决定是否需要更新记忆。具体来说，AMR比较笔记和记忆的内容质量，如果笔记内容更优，则替换记忆内容。

评估标准包括：信息是否包含与问题直接相关的关键信息、信息是否具有多个方面、信息是否包含足够的细节、信息是否实用

对应的prompt:

对于，决定何时停止检索：AMR建立了三个停止条件来控制信息收集的进程：无效更新次数、最大信息收集步数和最大去重检索段落数。满足任意一个条件都会触发迭代过程的终止。

3、任务导向生成器（Generator

利用最优记忆作为上下文，通过LLM的零样本上下文学习（ICL）生成最终答案。

最后，生成器根据最优记忆生成最终答案。针对不同任务的输出风格，设计了相应的提示模板，确保生成高质量的答案。

4、一个具体实例

我们可以看看一个具体实例，看下执行过程：

总结

本文主要看了最近的三个RAG进展，包括Astute RAG、KRAG Framework、StructRAG、Retriever-and-Memory等几个工作，可以看到，这些工作很臆想，实操性和落地性并不强，但思路可供阅读，清一色的拟合思路。

批判的看，会更有收获。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-05

AI 知识库为什么总答不准？不是模型笨，是资料没整理好

2026-07-05

AI知识库RAG演进：上一代解决「找得到」，下一代解决「记得住、连得起、信得过」

2026-07-04

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-03

RAG 检索优化策略：从命中率到答案质量的一套工程打法

2026-07-03

RAG 落地总翻车？全球赛事冠军架构，改造适配企业级生产

2026-07-01

提升 RAG 准确率全攻略让你的 AI 知识库真正靠谱起来！

2026-06-30

教程：如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

2026-06-30

知识库不是文件堆——我把RAG准确率从60%调到了92%

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

2026 年做搜索就是做 Agent Memory

2026-04-23

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

2026年知识库幻觉根治指南：从 Naive RAG 到 Agentic RAG

2026-05-14

RAG已死？不，是Grep回归了！

2026-04-30

Mem0 深度解析：智能记忆层的架构原理

2026-04-27

大家都在问

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-04

谷歌发布OKF（Open Knowledge Format）规范，它与Karpathy的LLM-wiki是什么关系？

2026-06-23

RAG 的尽头，是 SQL？

2026-06-23

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw