微信扫码
添加专属顾问
Wang 等人[1]提出基于 LLM 的自主智能体架构设计应该包括四个组成部分:分析模块、记忆模块、规划模块和动作模块(如图1所示)。记忆模块在智能体架构设计中起着非常重要的作用。它不仅存储从环境中感知到的信息,还能通过分析这些信息来帮助智能体更好地理解和适应其所处的环境。这种信息的处理和存储机制,使得智能体能够从过去的行为中学习,并基于历史数据预测和规划未来的行动。因此,记忆模块是链接感知信息与智能决策的关键桥梁。
图1:基于大语言模型的自主智能体架构设计的统一框架
此外,记忆模块通过积累的经验促进智能体的自我进化。例如,通过对成功和失败的行动进行回顾和总结,智能体可以优化其行为策略,逐渐提升处理复杂情况的能力。这种进化过程是动态的,反映了智能体在与环境互动中逐步完善自身的能力。
记忆模块还有助于智能体维持行为的一致性和逻辑性。通过长期存储重要的决策依据和行为准则,智能体能够在面对类似情境时,快速提取相关记忆,确保行为的一致性和合理性。这不仅提高了响应的效率,也保证了行动的适当性和有效性。
在大语言模型中,主要有两种记忆设计方案。一种方案是基于注意力的记忆设计,这种设计深入探究大语言模型的内部机制,通过保存模型过去输出的中间状态作为记忆内容,并在未来的处理中根据需要检索这些记忆来辅助当前响应的生成。
具体而言,如图2所示的 MemTRM[2],对 Transformer 模型的顶层进行了创新性的修改。该系统采用了k最近邻和局部注意力机制的结合,形成了一种混合注意力机制。在这种机制下,模型在处理输入数据时,会首先将顶层的键(K)和值(V)向量存储于一个外部的记忆库中。随后,在模型需要生成响应时,通过k近邻搜索算法检索记忆库中与当前输入最相关的内容(token 级别),并使用这些内容来生成混合注意力层的语义嵌入。
这一设计不仅使得混合层能够关注到当前的输入信息,还能够“回忆”起模型在处理之前相似情境时的状态,从而有效扩充了Transformer的输入上下文长度。此外,通过这种方式,模型能够更加精准地捕捉到与当前任务相关的历史信息,从而提高整体的处理效率和响应质量。
图2:通过访问之前见过的子序列的键值对来扩展 transformer
然而,MemTRM系统在训练过程中遭遇了记忆陈旧的问题。具体来说,随着模型训练的继续进行,后期保存的键值对与前期保存的键值对在数据分布上出现了显著差异。这种分布的变化会导致模型在检索记忆时的效率和准确性降低,对于模型的性能是一大挑战。
为了解决这一问题,LongMEM[3] 提出了一种创新的解决方案,即将记忆的存储和检索过程进行解耦(如图3所示)。该方法中,LongMEM 选择冻结 Transformer 的某些参数,从而保持了键值对的分布稳定。这种设计有效避免了由于模型持续学习导致的记忆陈旧问题。
此外,LongMEM 还引入了一个可训练的边缘网络(SideNet),以及残差连接来融合历史信息。边缘网络专门用来处理和整合来自记忆库的信息,而残巻连接则帮助模型在保持前向传播的同时,加入更多历史上下文。这种结构不仅解决了记忆陈旧的问题,还通过扩展Transformer模型的输入上下文长度,进一步提高了模型对长期依赖信息的处理能力。
图3:LONGMEM 的整体架构,“MemAug”表示记忆增强层
另一种记忆设计方案是使用 RAG(Retrieval-Augmented Generation)的方式来提供记忆支持。这种方法的特点是记忆模块与模型主体相对独立,不需要直接访问大模型的内部内容,因此特别适用于闭源模型的记忆增强。与基于注意力的设计不同,RAG 方案主要保存句子级别的语义信息,而非单个 token 的信息。
在外部记忆库的实现上,这种方案具有多种形式。例如,MemoryBank[4],它采用向量库的形式存储了过去的对话记录、事件摘要和用户特征,利用向量相似度计算技术来加速记忆的检索过程。如图4所示,MemoryBank 将对话数据作为基本的记忆单元,不仅存储简单的对话文本,还从这些对话中动态提取并总结出关键事件和用户画像,这些高阶的记忆信息为智能体提供了丰富的背景知识。
此外,MemoryBank 还引入了类似艾宾浩斯遗忘曲线的机制来管理记忆的存储。这意味着每条记忆都有一个与之相关的“记忆强度”,该强度会随时间逐渐衰减。当记忆强度降至某一阈值以下时,该记忆将被视为低价值信息并从记忆库中清除,从而为新的记忆释放空间。
在实际应用中,当智能体如 SiliconFriend 接收到一个查询(Query)时,它会从 MemoryBank 中检索与该查询相关的事件总结、用户画像及相关对话。这些信息被用来填充“Meta Prompt”,进而帮助模型生成更加精准和具有建议性的回答。这种基于检索的记忆增强方法不仅提高了响应的相关性和质量,也使得模型能够更好地适应用户的具体需求和历史背景。
图4:MemoryBank 的整体架构以及 MemoryBank 增强的人工智能伙伴—SiliconFriend
AI-town5 成功地构建了一个名为 Smallville 的虚拟小镇,这里居住着25个 AI 智能体,他们不仅有各自的工作,还能进行社交活动,如八卦交流、结交新朋友,甚至举办情人节派对。每个智能体都拥有独特的个性和背景故事,这些特征丰富了小镇的社会动态和互动复杂性。
记忆检索是AI-town运行的关键环节。如图5所示,该系统在检索记忆时考虑三个主要因素:相关度、新近度和重要性。这三个因素的得分相乘,形成了记忆片段的最终检索得分。得分越高的记忆片段越容易被检索出来,从而被用于指导智能体当前的行动和决策。
这种综合评分机制确保了智能体能够高效地从庞大的记忆库中检索出最相关、最有用的信息,从而提高响应的准确性和适时性。通过这种方式,AI-town中的智能体能够更加自然和有效地与环境及其他居民互动,展现出更贴近真实世界的社会行为。
图5:AI-town 的检索方式
AI-town 在其智能体设计中采取了一种创新性的反思机制,进一步提升了智能体处理信息和做出决策的深度。这个机制不仅仅停留在简单的观察层面,而是将这些观察转化为在特定条件下的更抽象、更高阶的反思。如图6所展示的,智能体 Klaus Mueller 的记忆被构建成一棵反思树,其中叶节点代表对世界的直接观察,而这些观察经过层层递归的总结和综合,最终形成了表达 Klaus 高阶自我观念的节点,即他对研究工作的高度投入与专注。
在记忆检索阶段,AI-town 的系统会平等地处理这两种记忆:基础的观察和高阶的反思。这种方法使得智能体在处理查询或决策时,不仅考虑具体事件的直接信息,还融入了从过去经验中提炼出的深层洞察和策略。通过这种方式,智能体能够展现出更加复杂和成熟的行为模式,更好地适应和响应其社会环境。
图6:Klaus Mueller 的反思树
在 ChatDB[6] 中,记忆支持采用了数据库形式的组织结构,这种结构为历史信息的精确记录和管理提供了强有力的支持。数据库作为外部记忆库,不仅能够存储大量数据,还能够通过结构化查询语言(SQL)高效地进行数据检索和操作,从而大大提高了信息处理的准确性和效率。
此外,ChatDB 特别引入了有监督微调技术(Supervised fine-tuning, SFT),这一技术使得 ChatDB 能够理解和转换用户的自然语言查询。具体来说,当用户通过自然语言提出查询请求时,ChatDB 可以自动将这些查询转换为适当的 SQL 语句。这一过程不仅简化了用户与系统的交互,也使得非技术用户无需了解复杂的 SQL 语法即可直接利用数据库资源。
图7:ChatDB 的整体工作流,聚焦于利用数据库作为符号记忆库增强大语言模型
本文简要介绍了大语言模型中的两种主要记忆设计方案,旨在提供一个对这些复杂技术的初步理解。对于希望深入了解大语言模型记忆机制的读者,推荐参考 Zhang 等人7撰写的详尽综述。这篇综述全面探讨了基于大语言模型的智能体的记忆机制。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-15
2026-04-22
2026-04-07
2026-04-07
2026-04-09
2026-05-15
2026-04-24
2026-04-05
2026-04-17
2026-04-05
2026-07-01
2026-06-30
2026-06-28
2026-06-27
2026-06-26
2026-06-26
2026-06-25
2026-06-23
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。