KG2-RAG：利用图谱来增强LLM生成效果

发布日期：2025-02-13 07:42:15 浏览次数： 3076

作者：自然语言处理算法与实践

微信搜一搜，关注“自然语言处理算法与实践”

1、前言

目前在RAG方向，存在两个主要的方向，一个是检索文档+rank方式来提升LLM，一个是利用图谱（知识库）来提升LLM，形式如下：

两种方式存在的优缺点是：

（1）第一种就是采用检索+rank方式来获取相关片段来增强大模型生成，优点就是简单有效；缺点是存在检索到很多与query无关的片段，增加噪声输入，与query关联的信息比较稀疏，需要LLM本身去提炼或挖掘利用；且一般是直接将检索的片段（chunks）放入指令中，忽略了片段中的内在关联信息或者query中的核心实体与片段的关联信息；

（2）第二种是利用query去检索图谱的信息，然后过滤有效的信息输入LLM；该方式优点就是检索到的信息是以实体及实体关联的形成呈现，信息密度比较高，噪声小；缺点就是：对图谱的信息质量要求比较高；此外，提供的信息比较单一，覆盖率比较小。

若按检索来理解，第一种方式是召回率高，准确率低些；第二种是准确率高，但召回率低些。为此，今天讲述一个新的框架——KG2RAG，其主要将上述两种方式融合起来用。当然，这种想法并不新奇，也有类似的工作，今天主要看看KG2RAG具体是如何实现的。

2、模型

上图为KG2RAG的整体流程图，下面详细来说下

2.1 Document Offline Processing

首先，对语料库文档进行离线处理：1）将每个文档按一定规则（固定长度）方式切成片段（chunk）；2）对每个片段做下增强处理，包括抽取相关元信息（标题、摘要等）、以及该片段涉及到的相关query信息等；3）得到一个片段集合

其次，为了获取每个片段中包含的实体之间的信息，利用LLM从每个片段中抽取三元组信息，形成图谱。具体形式为：

其中h，r，t分别表示头实体，关系，尾实体，c为对应的片段。该抽取的过程与query无关，所以该过程是可以离线来操作。三元组抽取的指令形式如下：

2.2 KG-enhanced Chunk Retrieval

有了上述的语料离线处理，接下来就是如何来利用这些信息来检索增强llm。包含两个步骤：1）Semantic-based Retrieval；2）Graph-guided Expansion。

1）Semantic-based Retrieval

该过程就是熟知的检索+rank过程，即给定一个query，计算它与片段集合D中相关的片段的相似度：

其中，s(.) 为相似度计算函数。通过相似度对检索的片段rank，选择top-k个片段作为检索信息，记为

作为语义检索的结果。

2）Graph-guided Expansion

利用离线构建好的图谱信息和检索的片段，可以得到一个与query相关的子图信息，即：

按近邻m-hop的搜索方式对上述的子图进行扩充，得到扩充后的子图，接着讲扩充后的子图所关联的片段形成一个新的集合，作为利用图谱后扩充的片段信息，即：

2.3 KG-based Context Organization

在利用上述2.2步骤扩充后的片段集合后，可能存在片段数量过多，超过最大输入长度等问题，为了解决这些问题，需要进一步进行过滤与重组。

1）Serving as a Filter

首先将扩充后的图变成一个无向带权重的图，计算方式如下：

其中

代表无向边，rel，src，weight作为属性信息，权重计算来自所在片段与query的相似度。

接着根据图的链接性，可以将其分成几个独立的子图（如figure2中色块所示），表示为，其中i代表数量。为了限制某个子图过于庞大，可以按maximum spanning tree（MST）的方式对每个子图进行裁剪过滤，形成过滤后的子图：

2）Serving as an Arranger

接着对上述的子图再进行重排，计算方式如下：

其中C(.)代表cross-encoder reranking function重排函数，conc(.)是代表某个子图中包含的所有三元组进行拼接。可以看出重排的时候，就没有用片段的表征向量，而是用了三元组的信息，目的是三元组的信息更为准确。

最后利用重排的分数，选择top-k相关的片段进行拼接，作为最终的检索信息，输入LLM中进行解码生成。

3、实验

上图是主实验结果，在4个数据集，对比了4种不同的RAG方式，验证了回答质量和检索质量两个维度，显示：

（1）在4个数据集上，论文提出的KG2-RAG在reponse quality上都有非常明显的提升；

（2）与KG2-RAG效果像接近的是Hybrid RAG和Semantic RAG+Rerank；

（3）比较热门的GraphRAG在四个数据集上表现的很差，这个挺让人意外的。

上图是显示对Graph-guided Expansion与KG-based Context Organization的消融实验，显示：

（1）在reponse quality上，Expansion方式对影响的更大；

（2）在retrieval quality，Organization方式影响的更大，而没有Expansion方式，检索的质量更高，说明利用KG可以提高检索质量。

4、结语

本次分享一个KG2-RAG框架，其主要思路利用片段构建图信息，进一步增强片段信息，其中核心是利用检索的图扩充片段，以及利用图对检索片段进行重排。整体看来，相比正常的RAG流程，其在线推理成本没有增加太多，构建图谱的环节可以离线实现，觉得某些应用场景可值得试试。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-05

AI 知识库为什么总答不准？不是模型笨，是资料没整理好

2026-07-05

AI知识库RAG演进：上一代解决「找得到」，下一代解决「记得住、连得起、信得过」

2026-07-04

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-03

RAG 检索优化策略：从命中率到答案质量的一套工程打法

2026-07-03

RAG 落地总翻车？全球赛事冠军架构，改造适配企业级生产

2026-07-01

提升 RAG 准确率全攻略让你的 AI 知识库真正靠谱起来！

2026-06-30

教程：如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

2026-06-30

知识库不是文件堆——我把RAG准确率从60%调到了92%

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

2026 年做搜索就是做 Agent Memory

2026-04-23

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

2026年知识库幻觉根治指南：从 Naive RAG 到 Agentic RAG

2026-05-14

RAG已死？不，是Grep回归了！

2026-04-30

Mem0 深度解析：智能记忆层的架构原理

2026-04-27

大家都在问

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-04

谷歌发布OKF（Open Knowledge Format）规范，它与Karpathy的LLM-wiki是什么关系？

2026-06-23

RAG 的尽头，是 SQL？

2026-06-23

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw