2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

十月月末RAG最新工作:AutoRAG、PlanxRAG及SubgraphRAG实现思路解读

发布日期:2024-10-31 12:19:48 浏览次数: 3205
作者:老刘说NLP

微信搜一搜,关注“老刘说NLP”

今天是2024年10月31日,星期四,北京,天气晴,2024年10月份的最后一天

本文主要介绍3个工作,一个是SubgraphRAG:知识图谱与RAG结合,一个是AutoRAG优化思路,一个是计划指导的检索增强生成PlanxRAG,其中涉及到的一些技术知识点,对我们进一步认识RAG及其前沿进展,有直接收益;

供大家一起参考并思考。

一、AutoRAG优化思路

继续来看工作,《AutoRAG: Automated Framework for optimization of Retrieval Augmented Generation Pipeline》,https://arxiv.org/abs/2410.20878,https://github.com/Marker-Inc-Korea/AutoRAG_ARAGOG_Paper,这个工作提出的AutoRAG是一个自动化框架,通过系统评估不同的RAG设置来优化技术选择,该框架类似于传统机器学习中的AutoML实践,通过广泛实验来优化RAG技术的选择;AutoRAG通过模块化节点和定义策略来动态选择最有前途的节点,构建接近最优的pipeline,提高RAG系统的效率和可扩展性。

这个工作更适合作为一个技术的回顾来看,以及怎么找到的最佳的组合策略,其 探讨了多种RAG技术,包括查询扩展、检索、段落增强、段落重排和提示创建。

1、All RAG techniques used in this paper

2、查询扩展(Query Expansion)

改善检索性能,通过扩展用户查询来创建更好的搜索查询。

Query Decompose使用LLM将多个问题分解为单个问题;

HyDE(Hypothetical Document Embedding)利用LLM生成假设性段落,提高与实际相关段落的语义相似度。

3、段落增强(Passage Augmenter)

通过获取额外的相关段落来增强检索性能。可以使用Prev-Next Passage Augmenter,利用相邻段落的元数据进行二次搜索,以找到与初始检索集上下文相关的更多段落。

4、段落重排(Passage Reranker)

在初始检索阶段后,对段落进行重新排序以提高检索的准确性。

包括有:

LM-based Reranker使用微调的语言模型对查询-段落对的相关性进行评分;

LLM-based Reranker利用LLM通过提示工程来重新排序段落;

Embedding-based Reranker使用密集向量表示来捕捉查询和文档之间的语义相似性;

Log prob-based Reranker基于从给定段落生成查询的对数概率来评估相关性。

5、提示创建(Prompt Maker)

将检索到的段落包含在提供给LLM的提示中,以实现上下文学习。其中可以使用的是,f-string将用户查询、检索到的段落和指令连接起来;long context reorder:解决“迷失在中间”现象,确保最相关的段落同时出现在输入提示的开始和结束部分。

4、各个阶段的评估指标

这块的评估指标包括很多,如下

二、计划指导的检索增强生成PlanxRAG

现有的Retrieval Augmented Generation(RAG)框架在处理复杂查询时的性能和幻觉问题,以及缺乏归因的问题。最近的工作《PlanxRAG: Planning-guided Retrieval Augmented Generation》,https://arxiv.org/pdf/2410.20753,Plan×RAG通过将传统的“检索-推理”范式转变为“规划-检索”范式,提出了一种新的处理复杂查询的方法。

从名字上看,PlanxRAG包括Plan和RAG两个部分。

一个是推理计划的表示是一个核心,Plan×RAG将推理计划表示为一个有向无环图(DAG),将主查询分解为相互关联的原子子查询。这种结构化的方法允许高效的信息共享和并行化处理。

1、一个具像化的例子

Figure 3展示了一个由推理计划专家生成的推理有向无环图(DAG)的例子。

展示了一个关于“最后两届男子板球世界杯决赛举办地之间的距离”的查询。这个查询被分解为以下几个子查询:

Q1.1:上一届男子板球世界杯决赛在哪里举行?
Q1.2:上上届男子板球世界杯决赛在哪里举行?
Q2.1:Q1.1中的答案地点的坐标是什么?
Q2.2:Q1.2中的答案地点的坐标是什么?
Q3.1:Q2.1和Q2.2中的答案地点之间的距离是多少?

在这个DAG中,Q1.1和Q1.2可以独立处理,Q2.1和Q2.2也可以独立处理,而Q3.1依赖于Q2.1和Q2.2的结果。这种结构不仅允许并行处理,还使得每个子查询的归因变得直接和清晰。如果Q3.1的结果不正确,可以通过检查Q2.1和Q2.2的结果来确定问题所在,并进行相应的修正。

几个特点:

相关信息流: 一个查询被分解为多个子查询,每个子查询都与相关信息流相关联。这意味着每个子查询只处理与它直接相关的信息,从而提高了处理的效率和准确性;

并行执行: 在DAG中,同一深度的子查询可以并行执行。这是因为这些子查询是相互独立的,可以同时处理,从而减少了总体的响应时间。这种并行化处理是DAG结构的直接结果,因为它允许系统同时处理多个节点;

固有的归因: DAG的设计使得每个子查询的生成可以直接归因到一个特定的检索文档。这种归因是固有的,因为每个子查询通常只依赖于一个相关的文档。这有助于提高系统的可解释性和信任度,因为可以清楚地追踪每个生成的响应与其来源文档之间的关系;

调试和回溯: DAG结构允许系统进行调试和回溯。如果生成的最终答案不正确,可以通过DAG的结构从叶子节点回溯到根节点,识别出错的节点,并对其进行修正。这种能力提高了系统的可调试性,使得可以更容易地识别和纠正错误。

2、关于DAG的过程

图3展示了一个推理有向无环图(DAG)的例子

每个节点都编号为⟨i.j⟩,其中i指的是节点距离根节点的深度,j指的是在同一深度的节点中的索引。推理DAG的一个显著特点是使用了一个特殊标签⟨AI.J⟩,它使得动态子查询的生成成为可能。在标签⟨AI.J⟩中,I和J是代表完成子查询所需的问题ID的整数值。例如,在图3中,子查询Q2.1依赖于子查询Q1.1的答案;特殊标签⟨A1.1⟩允许在运行时动态填充答案。

1) 查询分解:给定一个复杂查询,Plan×RAG首先将其分解为一系列更小、独立且相互关联的原子子查询。这些子查询是构成DAG的节点,每个节点代表一个需要回答的子问题。

2)构建DAG: DAG的构建遵循Markov假设,即一个子查询的答案仅依赖于其父节点的答案。 DAG的根节点是主查询,而叶节点是原子子查询,这些子查询可以直接通过单个文档回答。通过这种方式,DAG确保了查询的分解和组织,使得子查询之间没有循环依赖,并且所有节点都连接起来,形成一个有向的、无环的图结构。

3)查询DAG:在子查询中,使用特殊的标签来表示需要从父查询答案中动态填充的信息。这些标签在运行时被实际的答案替换,从而动态生成完整的子查询。

4)处理DAG:生成器(LM)按照拓扑顺序处理DAG中的每个节点。对于每个节点,都会调用一组插件式专家来控制生成过程,包括动态生成子查询、访问检索需求以及识别每个子查询的相关文档。此外,DAG的结构允许对同一深度的节点或DAG中独立路径上的节点进行并行处理,这显著减少了延迟,并提高上下文处理的效率。

3、关于多个专家

这个专家包括插件式专家(Plug-and-Play Experts):Plan×RAG集成了一组独立的插件式专家,如批评家专家(critic expert)和相关性专家(relevance expert),这些专家协同工作,提高LLM生成响应的准确性、可靠性和可解释性。

如上图所示,动态查询专家负责生成子查询,捕捉子查询之间的马尔可夫依赖关系,这个主要是根据prompt提示大模型生成;

批评家专家在生成过程中按需进行检索,评估何时需要额外的信息;

相关性专家精炼检索过程,确保选择最相关的文档;

聚合器专家将多个子查询的答案组合成对原始查询的综合响应;插拔式专家可以与任何预训练的LM集成。

三、SubgraphRAG:知识图谱与RAG结合

《Simple is Effective: The Roles of Graphs and Large Language Models in Knowledge-Graph-Based Retrieval-Augmented Generation》,https://arxiv.org/pdf/2410.20724,提出了一个名为SubgraphRAG的知识图谱(KG)增强型检索增强生成(RAG)框架。

SubgraphRAG旨在通过结合大模型(LLMs)和结构化的知识图谱(KGs)来解决LLMs在推理能力上的局限性,核心思想是先检索与查询相关的子图,然后利用LLMs进行推理和答案预测。

一个具像化的认识: 查询示例:图 1 中的查询是询问 “Which organizations have business partnerships with at least one company founded respectively by Elon Musk, Jeff Bezos, and Bill Gates - but weren't founded by any of them?”

子图检索:SubgraphRAG 会检索包含 Elon Musk、Jeff Bezos 和 Bill Gates 创立的公司以及与这些公司有商业合作关系的组织的三元组。

答案:在这个例子中,SubgraphRAG 返回的答案是 [Nvidia, Nasa]。Nvidia 与 Tesla(由 Elon Musk 创立)、Amazon(由 Jeff Bezos 创立)和 Microsoft(由 Bill Gates 创立)都有商业合作关系,而 Nvidia 本身并非由这三人中的任何一个创立。

可以看下其核心步骤:

SubgraphRAG的实现步骤可以分为以下几个关键阶段:

1、查询解析和实体提取(Query Analysis and Entity Extraction)

首先,SubgraphRAG从用户查询中识别出主题实体(Topic Entities)。这些实体是查询中直接提及的或者与查询紧密相关的知识图谱中的节点。

2、子图提取(Subgraph Extraction)

子图提取过程包括两个主要部分:

结构特征构建(Structural Feature Construction):这一步骤中,SubgraphRAG 会计算查询中的实体与知识图谱中实体之间的结构距离,使用方向性距离编码(DDE)来表示这些距离。

并行提取相关三元组(Extract Relevant Triples in Parallel):在这一步骤中,SubgraphRAG 并行地从知识图谱中提取与主题实体相关的三元组。

具体的,使用一个轻量级的多层感知器(MLP)模型来编码和评估潜在子图的相关性。然后,基于MLP的评分,从知识图谱中检索最相关的子图。

3、LLM推理(LLM Reasoning)

最后是,设计了专门的提示模板,这些模板指导LLM如何利用检索到的子图信息来生成答案。

总结

本文主要介绍了3个工作,一个是SubgraphRAG:知识图谱与RAG结合,一个是AutoRAG优化思路,一个是计划指导的检索增强生成PlanxRAG,其中涉及到的一些技术知识点,对我们进一步认识RAG及其前沿进展,有直接收益;

10月份就这么过了,时间真的过的很快,我们11月见;

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅