微信扫码
添加专属顾问
我要投稿
复旦大学邱锡鹏团队提出Zero-RAG技术,通过精准识别和剪除冗余知识,实现检索延迟降低22%且效果不降反升。核心内容:1. 揭示LLM与RAG知识高度重叠导致的效率问题2. Zero-RAG三大核心技术方案解析3. 实验数据证明剪除30%知识库仍保持性能
结论:外部 corpus 与模型内部知识高度重叠,继续"全量检索"≈ 白花钱、拖延迟、降效果。
复旦大学邱锡鹏提出Zero-RAG。首先提出了"掌握度评分"这一指标,用以精准识别RAG知识库中的冗余知识并进行剪除。经过剪枝后,对于模型已"掌握"的问题,其回答将主要依赖模型自身的内部知识。
一句话:"零冗余"不是口号,是真能剪、真加速、真不掉点。
结果:138M 句维基 → prune 30% 后索引体积同比例缩小。
消融显示:拿掉 Router 后 EM 显著下降,证明多检索一次反而添乱。
训练数据三种配方:
统一损失让模型学会忽略无用片段,靠内部知识作答。
经此微调,即使在 prune 后 corpus 里偶尔捞出无关句,模型也能"视而不见"。
❝句子:"Queen Victoria became Empress of India in 1876."
生成的 4 个 QA 全被 Llama3-70B 裸机答对 ⇒ Mastery-Score=1 ⇒ 直接剪除。
这些"教科书级别"的常识,就是 Zero-RAG 眼中该被"零冗余"的靶子。
Zero-RAG: Towards Retrieval-Augmented Generation with Zero
Redundant Knowledge
https://arxiv.org/pdf/2511.00505
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-06
RFT目前(在应用层)仍然是被低估的
2025-11-05
从 RAG 到 Agentic RAG,再到 Agent Memory:AI 记忆的进化三部曲
2025-11-05
万字详解Naive RAG超进化之路:Pre-Retrieval和Retrieval优化
2025-11-05
别只调模型!RAG 检索优化真正该测的,是这三件事
2025-11-04
大模型生态的“不可能三角”:规模化应用的架构困境?
2025-10-31
Dify知识库从Demo到生产:RAG构建企业级私有知识库的7个关键步骤
2025-10-31
RAGFlow 深度介绍
2025-10-29
RAG—Chunking策略实战|得物技术
2025-09-15
2025-09-02
2025-08-18
2025-08-25
2025-08-25
2025-08-25
2025-09-03
2025-09-08
2025-08-20
2025-08-28
2025-11-04
2025-10-04
2025-09-30
2025-09-10
2025-09-10
2025-09-03
2025-08-28
2025-08-25