GraphRAG工作原理揭秘及挑战

发布日期：2024-06-17 10:49:34 浏览次数： 3003

作者：知识图谱科技

微信搜一搜，关注“知识图谱科技”

帮助你理解GraphRAG机制的示例

开发一个能够解决真实问题并给出恰当、精准答案的聊天机器人真的是一项艰巨的任务。尽管大型语言模型取得了显著进展，但一个开放性的挑战是将这些模型与知识库相结合，以提供可靠且具有丰富上下文的回答。

照片由Google DeepMind在Unsplash上提供。

关键问题几乎总是归结为幻觉（模型生成错误或不存在的信息）和情境理解，模型无法理解不同信息之间的微妙关系。尽管其他人尝试构建强大的问答系统，但往往无法取得太大的成功，因为这些模型通常给出粗糙的答案，尽管它们与全面的知识库相连接。

虽然RAG可以通过将生成的回答与真实数据相关联来减少幻觉，但准确回答复杂问题则是另一回事。用户经常会遇到这样的答案：“检索到的文本中并没有明确涵盖xx主题”，即使知识库明确包含有关信息，只是以不太明显的方式呈现。这就是GraphRAG（图检索增强生成）派上用场的地方，通过利用结构化知识图谱，提高模型提供精确和丰富上下文答案的能力。

RAG：链接检索与生成

RAG在结合检索和生成方法的优点上迈出了重要的一步。给定一个查询，RAG从一个大型语料库中检索相关的文档或段落，再利用这些信息生成答案。这样一来，生成的文本就可以确保具有信息量且与上下文相关，因为它基于事实数据进行构建。

例如，在一个问题中，比如"法国的首都是什么？"，RAG系统将在其语料库中寻找与法国国家和其首都巴黎相关的文件。它将检索相关段落，并通过生成答案来回复，比如"法国的首都是巴黎。"这种方式非常适用于简单查询和明确文档化的答案。

然而，当需要理解实体之间的关系时，特别是在检索的文件中没有明确表述这些关系的复杂查询中，RAG会遇到问题。系统在像"17世纪的科学贡献如何影响20世纪初的物理学？"这样的问题上开始出现失败和崩溃（稍后将详细说明这个例子）。

GraphRAG：发挥知识图谱的力量

GraphRAG，正如 Microsoft Research Blog 在此处(微软的GraphRAG：智能问答系统的革命&重磅-微软发表GraphRAG论文并即将开源项目)首次概述的那样，旨在通过将基于图的检索机制融入模型中来克服这些限制。基本上，它将知识库的非结构化文本重新组织成结构化的知识图，其中节点表示实体（例如人物、地点、概念），边表示实体之间的关系。这种结构化格式使得模型能够更好地理解和利用不同信息之间的相互关系。

让我们现在稍微详细地了解一下GraphRAG的概念，以及与RAG的比较，采用简便的方法。

作为开始，我们来看一个假设的知识库，其中包含来自各种科学和历史文本的句子，如下所示：

1. “阿尔伯特·爱因斯坦发展了相对论理论，这一理论彻底改变了理论物理学和天文学。”

2. “相对论理论于20世纪初得到提出，并对我们对于时空的理解产生了深远的影响。”

3. “艾萨克·牛顿以他的运动定律和普遍引力定律而闻名，为经典力学奠定了基础。”

4. “1915年，爱因斯坦提出了广义相对论，对他早期的特殊相对论进行了拓展。”

5. “牛顿在17世纪的工作为现代物理学的许多理论提供了基础。”

在RAG系统中，这些句子将被存储为非结构化文本。比如，问“17世纪的科学贡献如何影响了20世纪初的物理学？”可能会使系统陷入困境，如果文档的确切措辞和检索质量未能直接将17世纪的影响与20世纪初的物理学联系起来。RAG可能给出以下答案：“艾萨克·牛顿在17世纪的工作为现代物理学奠定了基础。阿尔伯特·爱因斯坦在20世纪初发展了相对论理论”，因为机制能够检索相关信息，但无法清楚解释17世纪物理学对20世纪初发展的影响。

相比之下，GraphRAG将该文本转化为结构化的知识图谱。知识图谱表示不同事物之间的关系。它使用一组本体，即一组用于帮助组织信息的规则。这样，它可以找到隐藏的连接，而不仅仅是显而易见的连接。使用GraphRAG系统，前面的知识库将转换为如下所示的节点和边。

Nodes: Albert Einstein, theory of relativity, theoretical physics, astronomy, early 20th century, space, time, Isaac Newton, laws of motion, universal gravitation, classical mechanics, 1915, general theory of relativity, special relativity, 17th century, modern physics.

Edges:
- (Albert Einstein) - [developed] → (theory of relativity)
- (theory of relativity) - [revolutionized] → (theoretical physics)
- (theory of relativity) - [revolutionized] → (astronomy)
- (theory of relativity) - [formulated in] → (early 20th century)
- (theory of relativity) - [impacted] → (understanding of space and time)
- (Isaac Newton) - [known for] → (laws of motion)
- (Isaac Newton) - [known for] → (universal gravitation)
- (Isaac Newton) - [laid the groundwork for] → (classical mechanics)
- (general theory of relativity) - [presented by] → (Albert Einstein)
- (general theory of relativity) - [expanded on] → (special relativity)
- (Newton's work) - [provided foundation for] → (modern physics)

当被问到“17世纪的科学贡献如何影响了20世纪初的物理学？”时，基于GraphRAG的检索器可以识别从牛顿的工作到爱因斯坦的进展的过程，突出了17世纪物理学对20世纪初发展的影响。这种结构化的检索使得答案在语境上更加丰富和准确：“艾萨克·牛顿在17世纪提出的运动定律和万有引力定律为经典力学奠定了基础。这些原理影响了阿尔伯特·爱因斯坦在20世纪初发展的相对论理论，从而扩展了我们对时空的理解。”

在GraphRAG中使用结构化知识图谱增强了大模型回答复杂查询的能力，同时通过提供明确定义的关系来减少产生错误答案的机会，从而使其在开发更可靠和智能的对话式问答系统方面更加有效。将非结构化的知识库转化为结构化图谱还使得GraphRAG能够从信息中获得更深层次的含义，使语言模型能够在上下文中准确生成适当的回答。这是朝着更先进和可靠的聊天机器人系统发展的非常重要的进展。

然而，就像GraphRAG的其他好处一样，也存在着挑战。

首先，构建图谱很困难。将无组织的知识库转化为结构化的知识图谱需要很高的要求。这需要复杂的实体抽取和关系识别方法，这可能非常耗费计算资源。可以考虑从小图谱冷启动再到大图谱的分期构建方式GraphRAG应用中小图谱与大图谱的角色。

其次，出现了可扩展性问题。随着知识库的扩大，知识图谱的复杂性也随之增长。如果图谱在运行时变得过大而无法轻松遍历，这可能会对可扩展性提出质疑。一个主要的挑战将是优化用于大规模图谱的图检索算法，如何有效平衡利用知识图谱和大模型结合。

第三个问题涉及到维护开销：知识图谱需要不断更新新的信息和现有数据的变化。在某些领域，尤其是技术或医学领域，这种更新可能变得比较昂贵，因为这些领域知识很可能经常发生变化。这意味着，尽管结果可能是有希望的，但在维护知识图谱的正确性和相关性方面需要付出大量努力，因此对领域知识图谱的自动化更新及运维能力提出了较高要求。

尽管如此，GraphRAG承诺未来将具备更高智能性、可靠性和上下文意识的对话型AI Agent。进一步的研究和开发可以帮助缓解与GraphRAG相关的困难，为更复杂的基于GenAI的解决方案铺平道路。