微软最新研究：RAG（Retrieval-Augmented Generation）的四个级别深度解析

发布日期：2024-12-02 22:21:35 浏览次数： 3713

作者：大模型之路

微信搜一搜，关注“大模型之路”

当下检索增强生成（Retrieval-Augmented Generation，简称RAG）架构以其独特的优势逐渐崭露头角，尤其在处理复杂、多部分的查询时展现出了卓越的性能。微软，作为全球科技巨头，对RAG（小模型在RAG（Retrieval-Augmented Generation）系统中的应用：提升效率与可扩展性的新路径）的研究尤为深入，并提出了基于查询需求分层的RAG任务分类法，这一方法将用户查询划分为四个级别，今天我们一起了解一下这四个级别。

一、显性事实查询（Explicit Fact Queries）：RAG的基础构建

显性事实查询是RAG任务分类中的最基础级别，也是最简单的查询类型。这类查询直接请求特定的、已知的事实，答案直接存在于给定的数据中，无需任何额外的推理过程。用户提出的问题，其答案可以直接从数据块中提取出来。例如，用户询问“谁发明了电话？”答案“亚历山大·格雷厄姆·贝尔发明了电话”便是直接从外部数据中检索得出的。

在处理显性事实查询时，RAG架构的关键在于高效检索和准确匹配。微软通过利用BERT等模型将查询和文档编码为稠密向量，进行相似度匹配，从而在海量数据中快速定位并提取所需信息。此外，BM25等经典检索算法也发挥着重要作用，它们基于词频和文档频率进行相关性排序，确保检索到的信息与用户查询高度匹配。

显性事实查询的应用场景广泛，包括知识问答、信息检索等。在这一级别，RAG架构（检索增强思考 RAT（RAG+COT）：提升 AI 推理能力的强大组合）主要依赖于向量空间和语义相似度的计算，以实现快速、准确的答案抽取。

二、隐性事实查询（Implicit Fact Queries）：推理与行动的引入

隐性事实查询相较于显性事实查询更为复杂，它们要求揭示数据中隐含的事实，这些事实并非立即显而易见，而是需要一定程度的常识推理或基本逻辑推断。所需信息可能分散在多个数据片段中，或者需要通过简单的推理过程才能获得。例如，问题“哪个国家在2020年奥运会上获得的金牌最多？”便需要检索多个国家的金牌数据，并进行比较。

在隐性事实查询中，RAG架构开始引入推理和行动元素，因此更需要一种更为agentic（代理式）的解决方法。微软在这一级别采用了多跳推理和信息聚合技术，通过构建文档之间的关系图，进行多轮检索和逐步收集所需信息。同时，利用图神经网络和迭代检索方法，有效组合来自不同源的信息，生成全面、准确的答案。

隐性事实查询的应用场景同样广泛，包括但不限于数据分析、决策支持等。在这一级别，RAG架构不仅需要检索能力，还需要一定的推理能力，以揭示数据中隐含的规律和模式。

三、可解释的推理查询（Interpretable Rationale Queries）：领域知识与逻辑推理的结合

可解释的推理查询进一步提升了RAG架构的复杂性，它们不仅要求掌握事实，还要求能够理解并应用与数据背景密切相关的领域特定推理依据。这类查询需要同时具备事实知识和解读领域特定规则的能力，这些规则通常来自外部资源，而在通用语言模型的初始预训练中很少遇到。

例如，在金融审计领域，语言模型需要遵循监管合规准则来评估公司的财务报表是否符合标准；在技术支持场景中，则需要遵循预定义的故障排除工作流程来有效响应用户查询。这些应用场景都要求RAG架构能够提供精确且符合规范的响应，同时生成清晰、可理解的推理过程解释。

为了实现这一目标，微软在RAG架构中引入了神经符号结合方法，将神经网络与符号推理系统相结合，并使用Chain-of-Thought提示技术引导语言模型进行步骤化推理。这些技术使得RAG架构能够在特定领域中表现出色，同时提供可解释的推理过程，增强用户对答案的信任度。

四、隐式推理查询（Hidden Rationale Queries）：挖掘深层次的模式与含义

隐式推理查询是RAG任务分类中的最高级别，也是最具挑战性的类别。这类查询要求AI模型推断出复杂且未明确记录的推理依据，这些依据依赖于数据中的模式和结果分析。例如，在IT运营领域，语言模型需要从云运营团队解决的历史事件中挖掘隐性知识，识别成功的策略和决策过程；在软件开发中，则需要从以往的调试错误记录中提取出指导性原则。

在处理隐式推理查询时，RAG架构需要依赖强大的全局检索能力和深层次的理解能力。微软通过引入知识图谱和社区检测机制，实现了对信息结构的深度挖掘和全局性把握。GraphRAG（GraphRAG原理深入剖析-知识图谱构建）作为微软在这一领域的创新成果，利用大型语言模型从源文档中提取实体、关系和属性等信息，构建结构化的知识图谱。通过社区检测算法识别紧密相关的实体组（社区），并为每个社区生成摘要，从而能够全面、准确地回答复杂、多主题的问题。

隐式推理查询的应用场景包括但不限于战略决策、市场分析等。在这一级别，RAG架构不仅提供了答案，还揭示了答案背后的深层次模式和含义，为决策提供了有力的支持。

五、RAG 四个级别在实际应用中的重要性

（一）提升系统响应的准确性

通过区分不同级别的查询，RAG 系统能够更精准地理解用户需求。对于明确事实查询，能够快速提供准确答案，避免不必要的推理导致的错误。而对于需要推理的查询，能够根据相应级别采用合适的方法进行处理，提高答案的准确性。
在涉及复杂问题的场景中，如可解释理由查询和隐藏理由查询，系统提供的逻辑解释和基于数据的推理能够增强用户对答案的信任度，使得用户能够更好地理解和评估系统的输出。

（二）满足多样化的用户需求

用户在不同场景下的问题复杂程度各异。从简单的事实查询到深度的决策支持需求，RAG 的四个级别能够覆盖广泛的用户问题类型。无论是普通用户获取知识，还是专业人员进行复杂的分析决策，都能在 RAG 架构中找到合适的解决方案。
不同行业和领域的应用需求也得到了满足。例如在教育领域，学生的基础知识查询可以通过 Level 1 和 Level 2 的 RAG 来满足，而教师在教学研究中可能需要 Level 3 和 Level 4 的 RAG 来获取深入的教育理论解释和教学策略分析。

（三）推动智能决策的实现

在企业管理、金融投资等领域，Level 3 和 Level 4 的 RAG 能够为决策提供基于数据和逻辑的支持。通过分析复杂的业务数据和市场信息，系统能够提供有价值的见解和建议，帮助决策者做出更明智的选择。
对于科学研究和技术创新，隐藏理由查询级别的 RAG 能够助力研究人员从大量历史数据中挖掘新的思路和方法，加速科研进展，促进技术的不断创新和发展。

微软研究的RAG（GraphRAG原理深入剖析--图谱检索）四个级别不仅体现了LLMs需要理解的复杂性和多样性，也指明了各个层次的关注点。前两个层次主要聚焦于事实信息的检索，无论是直接呈现的还是需要基本推理得出的；而后两个层次则将重点转向了LLMs学习和应用数据背后逻辑的能力。希望对大家构建RAG系统所有帮助