微信扫码
添加专属顾问
我要投稿
EraRAG突破传统GraphRAG限制,实现动态语料库的高效更新与检索,为RAG系统带来革命性提升。 核心内容: 1. EraRAG的多层图构建框架与LSH技术应用 2. 高效增量更新机制的设计与实现 3. 大规模基准测试中的性能优势与实验结果
https://arxiv.org/pdf/2506.20963
这篇论文提出了EraRAG,一种多层图构建框架,通过结合超平面基于的局部敏感哈希(LSH)来实现高效的增量图更新。具体来说,
LSH-based图构建框架:EraRAG通过递归的LSH分段和总结来构建多层图。每个向量被投影到n个随机采样的超平面上,并编码为一个n位二进制哈希码。具有相似哈希值的向量被分组到同一个桶中。通过第二阶段的划分,生成最终的分段。
高效增量图更新机制:EraRAG通过结合超平面基于的LSH和可控的分区策略来实现快速的局部更新。新加入的块被编码成向量嵌入,插入到相应的桶中,并进行向上的传播调整,仅限于受影响的段落,而不改变无关部分。
查询处理:EraRAG采用折叠图搜索策略,在接收到查询后,首先将其编码成一个嵌入向量,然后在预定义的令牌预算下从向量数据库中检索最相似的节点嵌入,并将检索到的块连接成一个上下文传递给语言模型生成最终响应。
静态QA性能:EraRAG在大多数情况下均优于所有基线方法,特别是在QuALITY数据集上,EraRAG的准确率比RAPTOR提高了4.8%。
动态插入消耗:EraRAG在HotpotQA、PopQA和QuALITY数据集上的动态更新效率和令牌消耗均最低。与RAPTOR相比,EraRAG在PopQA数据集上减少了高达57.6%的令牌使用,在QuALITY数据集上减少了77.5%的图重建时间。
增量性能评估:每次增量更新都逐步提高了检索质量,最终检索性能接近完全重建图的静态上限,验证了EraRAG的选择性重建机制的鲁棒性。
小规模增量插入效率分析:在小规模增量插入实验中,EraRAG的更新时间和令牌消耗显著低于基线方法,特别是在多跳推理数据集MultihopRAG上,EraRAG的更新时间比GraphRAG减少了两个数量级。
抽象QA性能:EraRAG在计算机科学、法律和混合知识领域的抽象数据集UltraDomain上,以及在多跳推理数据集MultihopRAG的抽象总结问题上,均表现出色,优于GraphRAG和RAPTOR。
初始图覆盖率对检索性能的影响:初始图覆盖率在50%-70%之间时,检索性能最佳,确认了初始结构对最终检索图质量的持久影响。
分段大小对结构权衡的影响:适当的分段大小有助于平衡效率和检索质量,过大或过小的分段都会影响性能。
不同骨干语言模型的鲁棒性:EraRAG在不同骨干语言模型(如GPT3.5 turbo和GPT4-o-mini)上保持稳定的性能,所有指标波动在10%以内。
查询类型处理效果:EraRAG能够有效处理详细查询和总结查询,确保在增量更新过程中不引入幻觉。
块大小对检索准确性和图构建效率的影响:块大小对检索质量影响有限,但适当的选择可以优化效率。
这篇论文提出了EraRAG,一种可扩展且高效的基于图的检索增强生成框架,能够在动态语料库更新时无需完全重建。通过结合超平面基于的局部敏感哈希和选择性重聚类,EraRAG实现了增量图构建,同时保持了先前建立结构的语义完整性。广泛的实验表明,EraRAG在准确性和召回率上均优于现有的RAG基线,并且在更新过程中显著减少了令牌消耗和图构建时间。
论文评价
问题1:EraRAG是如何利用超平面基于的局部敏感哈希(LSH)来实现高效的增量图更新的?
EraRAG通过结合超平面基于的局部敏感哈希(LSH)和可控的分区策略来实现快速的局部更新。具体步骤如下:
问题2:EraRAG在处理动态语料库时的性能如何,与其他方法相比有何优势?
EraRAG在处理动态语料库时表现出显著的优势:
问题3:EraRAG在查询处理阶段采用了什么策略,如何平衡详细信息和高层次语义信息?
EraRAG在查询处理阶段采用了折叠图搜索策略,平衡详细信息和高层次语义信息的策略如下:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-30
涌现观点|RAG评估的"不可能三角":当独角兽公司因AI评估失误损失10亿美元时,我们才意识到这个被忽视的技术死角
2025-08-29
RAG2.0进入“即插即用”时代!清华YAML+MCP让复杂RAG秒变“乐高”
2025-08-29
利用RAG构建智能问答平台实战经验分享
2025-08-29
RAG如七夕,鹊桥大工程:再看文档解析实际落地badcase
2025-08-29
基于智能体增强生成式检索(Agentic RAG)的流程知识提取技术研究
2025-08-29
RAG 为何能瞬间找到答案?向量数据库告诉你
2025-08-28
寻找RAG通往上下文工程之桥:生成式AI的双重基石重构
2025-08-28
万字长文详解优图RAG技术
2025-06-05
2025-06-06
2025-06-05
2025-06-05
2025-06-20
2025-06-20
2025-07-15
2025-06-24
2025-06-24
2025-06-05