我要投稿

Multi-Head RAG：复杂问题的RAG召回方案

发布日期：2024-08-11 04:33:03 浏览次数： 3024

作者：NLP前沿

微信搜一搜，关注“NLP前沿”

这个工作要解决个什么问题呢？ RAG 得流程是通过将文档召回，放入LLM的上下文中，来提供更准确和相关的答案。但是现有的 RAG 解决方案可能比较难处理，召回的内容来自完全不同的文档，因为这些文档在语义空间中可能很远，很难将它们全部检索出来。

论文中有张图如下图，正常的RAG在遇到query有点复杂的时候，在召回的时候就很麻烦。如果是纯粹的绿点主题或者黄点主题那都没太大问题。但是如果是复杂的多主题的，到向量空间之后就不好召回了。

那咋整呢，大概的一个方案就是下图，query被拆解成了多个向量，每个向量比较纯粹，类似于多路召回，总能匹配到需要的chunk。

怎么获取多个向量呢？ MRAG通过使用Transformer的多头注意力层的特征作为向量表征，而不是仅使用取最后解码器层的输出，这样做的动机是不同的注意力头可以学习捕获数据的不同方面。每一层取一个向量，取最后一个位置的。chunks和query都生成多个向量，检索的时候，使用投票策略，结合了不同嵌入空间的重要性得分（根据一层的头内向量空间分布计算的），来选择最相关的文本块，并根据其重要性对检索结果进行加权。

最后结果在召回的相关性方面获得了比较大的提升

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-04

Claude Cowork 真能替换 RAG ？

2026-02-03

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

2026-02-02

OpenViking：面向 Agent 的上下文数据库

2026-02-02

别再迷信向量数据库了，RAG 的“大力出奇迹”该结束了

2026-01-29

告别黑盒开发！清华系团队开源 UltraRAG：用“搭积木”的方式构建复杂 RAG 流程

2026-01-28

RAG优化不抓瞎！Milvus检索可视化，帮你快速定位嵌入、切块、索引哪有问题

2026-01-28

今天，分享Clawdbot记忆系统最佳工程实践

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-04

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

RAGFlow v0.22.0 发布：数据源同步、变量聚合、全新管理界面与多项重大更新

2025-11-13

企业级 AI Agent规模化落地的避坑指南，就藏在这四大趋势里

2025-12-02

5步构建企业级RAG应用：Dify与LangChain v1.0集成实战

2025-11-13

2026 年你需要了解的 RAG 全解析

2026-01-15

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-07

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

从 RAG 到 Context：2025 年 RAG 技术年终总结

2025-12-18

大家都在问

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

为什么 RAG 越用越慢？如何反向调优？

2026-01-19

NotebookLM如何在48小时内分析2万份论文？

2026-01-12

都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

2026-01-08

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

终于，NotebookLM 和 Gemini 合体了。这是什么神之更新？

2025-12-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean

应聘简历请发送至： [email protected]

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部