我要投稿

HybRAG：混合文本和知识图谱的RAG框架

发布日期：2025-10-28 13:00:22 浏览次数： 2172

作者：Coggle数据科学

微信搜一搜，关注“Coggle数据科学”

在当今信息爆炸的时代，我们常常需要从半结构化知识库（Semi-structured Knowledge Base, SKB）中获取信息来回答复杂问题。这类知识库既包含文本文档，也包含实体之间的关联关系。然而，许多现实中的问题属于“混合型问题”，即同时需要文本信息和关系信息才能正确回答。

传统的检索方法往往难以兼顾这两类信息：

传统RAG 只检索文本，忽略了实体之间的关系；
图RAG（GRAG） 只关注知识图谱中的关系，容易遗漏文本内容；
问题路由方法 在识别问题类型时容易混淆文本与关系部分，导致检索失败。

HYBGRAG: Hybrid Retrieval-Augmented Generation on Textual and Relational Knowledge Bases

HYBGRAG 不仅是一个技术框架，通过多模态检索 + 自我反思的机制，实现了对复杂问题的精准理解与回答，特别适用于学术文献、企业知识库、智能客服等需要结合文本与关系的场景。

方法	适用问题类型	是否自适应	是否可解释	是否支持混合问答
传统RAG	文本问答	❌	❌	❌
Think-on-Graph	知识图谱问答	❌	✔	❌
AVATAR	文本+图谱问答	❌	✔	❌
HYBGRAG	全部类型	✔	✔	✔

问题定义：什么是混合问答（HQA）？

首先，明确一下研究范围：

半结构化知识库（SKB） = 知识图谱（实体和关系） + 文本文档集合
混合问题 = 需要同时使用文本信息和关系信息才能回答的问题
HQA的目标 = 从SKB中检索出既满足关系条件又满足文本条件的文档集合

🔍 挑战一：混合来源问题（Hybrid-Sourcing Question）

研究者比较了两种单一检索方式的效果：

文本检索器：基于向量相似度搜索，专注文本内容
图检索器：基于个性化PageRank，专注知识图谱关系

惊人发现文本检索和图检索的效果相当，但它们的优势领域几乎不重叠！如果有一个“完美调度器”总能选择正确的检索器，性能将大幅提升。

检索方法	Hit@1	Hit@5
纯文本检索	29.08%	49.61%
纯图检索	25.33%	55.23%
最优路由	45.22%	74.63%

这意味着：很多问题必须同时使用两种信息源才能正确回答。

🔍 挑战二：需要优化的问题（Refinement-Required Question）

在知识图谱问答中，成功的关键往往在于能否从图谱中提取出包含目标实体的正确子图。

研究者测试了LLM在首次尝试时能否提取出包含目标实体的子图：

迭代次数	反馈类型	命中率
1	无反馈	67.69%
2	简单重试	79.14%
2	纠正性反馈	92.31%

在混合问题中，LLM很难在第一次就准确区分文本方面和关系方面，经常把文本内容误认为是实体。

仅让LLM重试一次，命中率就能显著提升
如果提供具体的错误反馈（如“提取的主题实体错误”），效果提升更加明显

这两个挑战直接催生了HYBGRAG的核心设计：

针对挑战一 → 引入检索器组，同时利用文本和关系检索器
针对挑战二 → 设计评判模块，通过自我反思不断优化问题解析

HYBGRAG技术详解：如何构建自适应混合检索系统

检索器组

检索模块类型：

文本检索模块

基于向量相似度搜索
直接在文本文档中寻找答案
适用于纯文本问题或混合检索模块无法提取信息的情况

混合检索模块

输入：识别出的主题实体 + 有用关系
过程：从主题实体的自我图中提取实体，然后用VSS排序
关键创新：确保关系信息和文本信息的协同作用

路由器：智能调度中心

首先识别问题的关系方面（主题实体和有用关系）
然后决定使用文本检索还是混合检索模块
智能逻辑：如果识别不出任何实体，自动选择文本检索模块

对于问题"约翰·史密斯的纳米流体传热论文"，路由器会识别：

主题实体：{John Smith}
有用关系：{author writes paper}
选择：混合检索模块

评判模块

将复杂的评判任务分解为两个专门化的LLM：

验证器：判断检索结果是否正确
评论器：提供具体改进反馈

验证器：质量守门员

任务：二元分类，判断检索结果是否满足问题要求
关键创新：提供验证上下文（推理路径）
例子：使用路径"{作者} → {撰写} → {论文}"来验证结果

评论器：精准指导教练

任务：当检索错误时，提供具体改进反馈
反馈类型：纠正性反馈（非自然语言）

HYBGRAG实验验证

STARK基准测试结果：

方法	STARK-MAG (Hit@1)	STARK-PRIME (Hit@1)	相对提升
传统RAG方法	29.08%	12.63%	-
图RAG方法	13.16%	6.07%	-
自反思LLM	44.36%	18.44%	-
HYBGRAG	65.40%	28.56%	平均51%

多代理设计价值：

设计模式	Hit@1	说明
无代理	50.28%	仅混合检索模块
单代理	62.06%	路由器自行反思
多代理	65.40%	完整HYBGRAG设计

在CRAG基准测试中，HYBGRAG同样表现出色：

方法	Claude 3 Sonnet准确率
纯文本RAG	50.34%
纯图谱RAG	53.03%
文本+图谱RAG	58.20%
HYBGRAG	63.22%

框架使用的实体和提示词

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-22

RAG 不是先向量检索再回答：Metadata Filter 才是企业知识库的第一道门

2026-06-21

使用 LangSmith 进行 RAG 评估：构建生产级 RAG 系统的 AI 开发者指南

2026-06-20

RAG 投毒的六个影响因素与防御框架

2026-06-20

RAG 性能暴涨 5.9 倍！微软新框架让 LLM 自主检索，无需训练直接部署

2026-06-19

RAGular：适合知识库体质的 OCR 助手

2026-06-18

阿里扔出「向量版 SQLite」！十亿级向量毫秒检索，一行 pip install 搞定，本地 RAG 的游戏规则变了

2026-06-18

一个月拿下1500star，只因我们比MinerU多做了这件事

2026-06-18

为 1000 万+ 文档构建近零幻觉的 RAG Pipeline

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

RAG进化了，深扒Claude Code源码中RAG高级技巧

2026-04-02

OpenDataLoader：PDF文档提取的一站式方案

2026-03-31

2026 年做搜索就是做 Agent Memory

2026-04-23

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

大家都在问

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

到底是谁会相信RAG已死啊？

2026-05-11

1G内存检索2500万向量，Milvus中如何用FLAT在强标量过滤场景搞定毫秒响应？

2026-05-07

多Agent场景，子agent 之间数据读写不同步，如何解决？

2026-05-06

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw