我要投稿

GraphRAG成本打一折，KET-RAG多粒度索引新框架开源

发布日期：2025-03-16 11:50:53 浏览次数： 2553

作者：PaperIdea

微信搜一搜，关注“PaperIdea”

摘要速览

研究痛点：现有的基于图的检索增强生成（Graph-RAG）系统在处理大规模文档时面临两难困境。

一方面，基于文本块相似性的KNN图方法虽然成本低，但无法捕捉文本内部的实体关系，导致检索和生成质量欠佳；
另一方面，基于知识图谱（KG-RAG）的方法虽然能通过提取实体和关系提升检索质量，但其高昂的索引成本使其难以大规模应用。例如，处理5GB法律文档的索引成本可能高达3.3万美元。

创新突破：

提出了KET-RAG（Knowledge-Entity-Text Retrieval-Augmented Generation），一种多粒度索引框架。KET-RAG通过以下创新实现高效低成本的知识检索：

知识图谱骨架：仅从核心文本块中构建知识图谱，大幅减少索引成本。
文本-关键词二分图：作为知识图谱的轻量级替代，通过关键词与文本块的关联实现高效检索。
双通道检索策略：结合知识图谱骨架和文本-关键词二分图的优势，平衡检索质量和成本。

应用价值：在两个真实世界的数据集上评估了八种解决方案，结果表明，KET-RAG 在索引成本、检索效果和生成质量方面均优于所有竞争对手(Text-RAG、KNNG-RAG、KG-RAG、Hybrid-RAG、Skeleton-RAG)。

值得注意的是，KET-RAG 的检索质量与微软的 Graph-RAG 相当甚至更优，同时索引成本降低了超过一个数量级。

? 方案详情

KET-RAG框架的核心在于结合多粒度索引结构，具体包括以下部分：

知识图谱骨架（Skeleton-RAG）：通过PageRank算法从KNN图中选择重要文本块，并仅对这些核心文本块构建知识图谱，减少索引成本。
文本-关键词二分图（Keyword-RAG）：将所有文本块分割为子块，并构建关键词与子块的关联图。关键词及其邻近文本块作为候选实体和关系，用于轻量级检索。
双通道检索：在检索阶段，KET-RAG结合知识图谱骨架和文本-关键词二分图的优势，通过调整检索比例参数（??）平衡两者贡献，提升检索质量。
参数优化：通过调整输入文本块大小（ℓ）、分割层数（??）等参数，进一步优化检索和生成性能。

KET-RAG通过这种多粒度索引和双通道检索策略，在保证检索质量的同时，大幅降低了索引成本，为大规模知识检索和生成任务提供了高效、低成本的解决方案。

https://arxiv.org/pdf/2502.09304KET-RAG: A Cost-Efficient Multi-Granular Indexing Framework for Graph-RAG

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-22

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-20

GLM-5.2本地部署：744B参数模型如何在Mac上跑

2026-06-20

Hermes Agent v0.17发布：AI助手开始扩展触角

2026-06-18

开源中医 Skill：把倪海厦课程变成可检索知识库

2026-06-18

Gemma 4 QAT 模型现已推出: 支持日常端侧设备与消费级 GPU 本地流畅运行

2026-06-17

GLM-5.2 技术解读：智谱百万上下文的新一代旗舰模型

2026-06-16

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-12

当 AI Coding Agent 成为基础设施：我们为什么要开源 LoongSuite Pilot

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

刚刚，Claude Code开源了！51万行代码，全网狂欢

2026-03-31

龙虾绝配：Qwen 3.5 27B！跑在家里，成本为 0

2026-03-30

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

CoPaw深度解析：源码架构和功能实践

2026-03-31

炸裂！Seedance 2.0 免费用！全网第一只接入的开源龙虾，效果离谱

2026-04-02

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw