2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

类海马体的RAG检索策略

发布日期:2024-09-23 19:11:05 浏览次数: 2958
作者:AI 搜索引擎

微信搜一搜,关注“AI 搜索引擎”

今天分享的是来自俄亥俄州立大学的一篇文章 HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models,受神经生物学启发的大语言模型的长期记忆策略。
文章链接:https://arxiv.org/pdf/2405.14831
代码链接:https://github.com/OSU-NLP-Group/HippoRAG

摘要

这篇论文提出了一种名为 HippoRAG 的新型检索框架,灵感来源于人类长期记忆的海马体索引理论,旨在帮助大语言模型(LLMs)更高效地整合新的知识和经验。当前的 LLMs 即使结合检索增强生成(RAG)技术,仍然难以在预训练后高效地处理大量新信息。HippoRAG 将 LLMs、知识图谱以及 Personalized PageRank 算法结合起来,模仿新皮质和海马体在记忆中的不同角色,从而实现更深层次和高效的知识整合。

海马体索引理论

海马体索引理论可以用一个形象的比喻来解释:想象你有一个非常复杂的图书馆,里面有成千上万的书籍。这些书籍代表了你所有的记忆和知识。现在,图书馆有两个主要的区域:
  1. 书架区(新皮质):这是存放书籍的地方,你可以在这里找到每一本书。这些书籍代表了你处理和存储的各种信息和记忆。
  2. 索引卡区(海马体):这是一个存放索引卡的地方。每张索引卡上写着关于书籍的详细信息,比如书名、作者、主题等。索引卡帮助你快速找到你需要的书籍。
海马体索引理论认为,当你学习新东西时,信息首先进入“书架区”,即新皮质,然后通过“索引卡区”,即海马体,建立起索引卡。索引卡上的信息就是你记忆的关键信息和关联,用来帮助你在需要时找到具体的书籍或记忆。
当你想要回忆某件事时,你的脑海中会想起一些提示(就像查找索引卡),然后根据这些提示去“书架区”找到相关的书籍。这样,即使你只有一些部分信息(索引卡上的提示),也能帮助你完整地回忆起整个记忆(找到书籍)。
简单来说,海马体索引理论描述了大脑如何通过创建和利用记忆的“索引卡”来帮助我们更好地存储和检索信息。这使得大脑在面对新信息时,能够高效地更新记忆,同时保持过去的信息不丢失。

检索框架

我们结合框架图来理解这个框架是如何设计的以及如何模拟人类的记忆过程。
  1. 离线索引(Offline Indexing)
  • 新皮质模拟:左侧的第一个大脑图像代表新皮质区域,这里的信息被提取并转化为知识图谱。同时,合成的旁海马区(PHR)检测同义词。例如,在例子中,“Thomas, researches, Alzheimer's”和“Stanford, employs, Thomas”这样的三元组被提取并整合进知识图谱。
  • 知识图谱构建:右侧的大脑代表海马体及其周边区域,这里的信息来自新皮质,并被组织成知识图谱。在这个过程中,通过开放信息提取,将文本中的事件抽取出来,形成三元组结构,例如:“Thomas-researches-Alzheimer's”和“Stanford-employs-Thomas”。
  • 在线检索(Online Retrieval)
    • 记忆检索模拟:最下方的流程图展示了在线检索阶段的工作流程,首先从查询中提取关键信息,也就是查询实体。然后,这些实体被链接到知识图谱中的相应节点,链接依据是通过检索编码器确定的相似性。最后,通过个性化PageRank算法,从查询节点出发进行图搜索,以找到最相关的记忆片段。
    • 知识图谱检索:右侧展示了知识图谱检索的过程,箭头表示信息流,中间的大脑用彩色线条表示不同类型的关联。
  • 整体架构
    • 离线索引和在线检索之间的联系:离线索引阶段负责从大量文本数据中提取有用信息并将其组织成知识图谱;在线检索阶段则利用这些知识图谱来快速准确地响应用户的查询请求。

    实现方法

    在离线索引阶段,首先需要处理一组文本段落 ,使用一个指令调优的大规模语言模型 和一个检索编码器 。通过一次提示的方式,LLM 从每一段落中提取出名词短语节点 和关系边 ,这一过程通过OpenIE实现。在提取过程中,先从每个段落中识别出命名实体,然后将这些命名实体添加到 OpenIE 提示中,以提取包含概念(名词短语)在内的最终三元组。此外,检索编码器 被用来检测两个实体表示之间的高余弦相似度,当相似度超过预设阈值 时,会在知识图谱中添加额外的同义关系 。这一操作增加了知识图谱的连通性和冗余性,有助于更有效地完成模式匹配。最后,构建一个 的矩阵 ,记录每个名词短语在知识图谱中的出现频率。
    在线检索阶段,当接收到一个查询 时,首先使用 LLM 通过一次提示来提取查询中的命名实体 然后,这些命名实体被同一检索编码器 编码,并根据最高的余弦相似度选出与查询命名实体最相似的一组节点 接下来,使用个性化PageRank算法在知识图谱上运行,定义一个个性化的概率分布 #»n,使每个查询节点具有相同的概率,而其他节点概率为零。这使得概率质量集中在与查询节点最相关的邻近节点上。运行 PPR 算法后,得到更新的概率分布 #»n'。为了获得段落得分,将 #»n' 与之前定义的矩阵 相乘,得到用于检索的每段原始文本的排名得分 #»p。
    为了进一步提高检索效果,HippoRAG 引入了节点特异性(Node Specificity)。节点特异性是一种生物神经学上合理的方法,用于改进检索。节点 的特异性 定义为 其中 是包含节点 的所有段落集合。在检索过程中,通过将每个查询节点的概率 #»n 乘以相应的节点特异性 ,来调整其邻居节点的概率。这种方法允许在没有全局聚合的情况下利用局部信号来改进检索,从而避免了传统 IDF 方法在大脑中可能引入的计算开销。通过这种方式,HippoRAG 能够更好地模拟人类记忆系统的模式分离和模式完成功能。

    实验结论总结

    实验结果显示,HippoRAG 在单步检索和多步检索任务上均表现出色,并且这种检索性能的提升直接促进了问答任务的表现。
    在单步检索实验中,HippoRAG 在 MuSiQue 和 2WikiMultiHopQA 数据集上超越了包括 Propositionizer 和 RAPTOR 在内的其他基线方法。具体来说,在 2WikiMultiHopQA 数据集上,HippoRAG 在 R@2 和 R@5 上分别提高了 11% 和 20%,而在 MuSiQue 上也有大约 3% 的提升。这种差异部分归因于 2WikiMultiHopQA 的实体中心设计,该设计特别适合 HippoRAG。相比之下,在 HotpotQA 数据集上的表现稍逊一筹,原因在于此数据集对知识整合的需求较低,同时存在概念与上下文之间的权衡,但这个问题可以通过附录 F.2 中描述的集成技术来缓解。
    对于多步或迭代检索实验,结果显示 HippoRAG 和 IRCoT 是互补的。当 HippoRAG 作为 IRCoT 的检索器时,它继续带来了显著的性能提升,如在 MuSiQue 上 R@5 改善了约 4%,在 2WikiMultiHopQA 上改善了 18%,在 HotpotQA 上则有额外的 1% 改善。
    问答结果方面,使用 HippoRAG 作为检索器时,MuSiQue、2WikiMultiHopQA 和 HotpotQA 的 F1 分数分别提高了最多 3%、17% 和 1%,并且这种改进是在使用相同的 QA 阅读器情况下实现的。值得注意的是,单步 HippoRAG 的性能与 IRCoT 相当甚至更好,而且在线检索的成本更低,速度更快,成本效益比 IRCoT 高出 10 至 30 倍,速度也快了 6 至 13 倍。
    综上所述,HippoRAG 不仅在检索任务上取得了优异的成绩,而且由于其高效的检索性能,也间接推动了问答系统的效果,尤其是在多实体或多步推理场景下更为明显。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅