2026年6月11日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

腾讯开源了 Agent Memory,让 AI 真正记住你。_tag2

发布日期:2026-06-04 12:18:52 浏览次数: 1571
作者:逛逛GitHub

微信搜一搜,关注“逛逛GitHub”

推荐语

腾讯开源Agent Memory项目,让AI真正记住用户偏好与对话历史,显著提升Agent性能。

核心内容:
1. 主流AI记忆方案的三大短板与局限
2. 四层渐进式记忆架构的核心设计原理
3. 符号化短期记忆压缩与Mermaid图应用

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

腾讯开源了一个项目,两个月拿了 4600+ Star。

做的事非常专一:给 AI Agent 装上长期和短期记忆。

装完之后什么效果?

评测数据摆在这:针对长期记忆,整体准确率从 47.85% 涨到 76.10%,提升将近 60%。

用户事实召回从不到 30% 飙到 79%。

基于短期记忆的加持,长任务中最高节省 61% token。

这个项目叫 TencentDB Agent Memory,腾讯云数据库团队做的,5 月 14 日正式开源的。

来看看在 OpenClaw 和 Hermes 中的效果。

01

AI 记忆到底难在哪

现在,点击开一个 Agent 的新会话,其实都会默认认为它啥都不知道。

你得把相关的上下文或者信息给它说一遍,它才能干好活。

Memory 的目的还是提高我们的效率。

TencentDB Agent Memory 的思路和主流的方案不太一样。

它的思路是符号化短期记忆 + 分层长期记忆。

开源地址:https://github.com/TencentCloud/TencentDB-Agent-Memory

现在主流的解决方案大概有三种,但都有明显短板。

第一种,全塞进上下文窗口。

简单粗暴,但窗口有上限,塞多了 token 直接爆掉。

第二种,用向量数据库做记忆。

比全塞上下文好一些,但问题是只存不提炼,很多对话碎片时召回率低,精确度差。

第三种,让大模型自己做摘要压缩。

但压缩是不可逆的,可能会造成关键细节丢失的问题。

02

腾讯开源项目的核心架构

这个项目最核心的设计,是一个四层渐进式记忆架构。

L0 到 L3,从底到顶,每一层干的事不一样。

TencentDB Agent Memory L0 to L3 semantic pyramid

L0:原始对话。 

全量保留,一字不落。兜底用,随时可回查。

L1:原子事实。 

自动从对话里提取独立的事实节点,比如"我爱吃火锅"、"我后用 NextJS",打标签存起来。

L2:场景聚类。

相关的原子事实按场景聚合。比如用户系统讨论涉及的所有事实,表结构、权限、接口合成一个场景块,Markdown 格式,人可直接读。

L3:用户画像。 

基于下面三层生成稳定的用户画像,沉淀技术偏好、代码风格、常用工具链。

Retrievable and Recoverable Drill-Down Chain

这样既不会因为上下文太长影响推理,也不会丢失关键信息。

而且系统保证从顶层到原始证据有完整的回溯路径。

L3 里说用户偏好 TypeScript,这个结论可以追溯到 L2 某个场景块,场景块里的每条结论又能追溯到 L1 的原子事实,原子事实最终指向 L0 里你说过的那句话。

整条证据链不断裂。

03

短期记忆压缩:巧用 Mermaid 图

四层架构解决长期记忆,但短期上下文也是烧钱大户。

AI 排查一个 bug 要调用十几次工具,上下文塞满日志。

解法是符号化记忆,把完整日志卸载到外部文件,用 Mermaid 语法画一张紧凑的任务状态图塞进上下文,需要细节时再通过节点 ID 检索。

Mermaid 用极少的 token 把线性摘要列表重组为带状态、依赖关系和可寻址索引的任务拓扑结构图。

让 AI 大模型不靠记住什么标签而是靠从图的拓扑中推理出什么结构来理解任务全貌。

信息密度更高、结构不丢失、细节可逐层找回。

实测 Token 消耗直降超 50%,任务完成率反升 23%。

省了钱,活还干得更好。

语义检索(Embedding)擅长模糊匹配,关键词检索(BM25)擅长精确命中。

两路各自召回候选结果,RRF 融合排序。语义相关的不会漏,精确匹配的也不会丢

04

跑出来的数据

说了这么多设计,来看实际跑出来的数据。

腾讯用 PersonaMem 基准测试做了评测,对比的是原生 OpenClaw 和接入 Agent Memory 之后的 OpenClaw:

指标
原生 OpenClaw
接入 Agent Memory
总准确率
47.85%
76.10%(+59%)
用户事实召回
29.63%
79.07%(+167%)
偏好跟踪
66.67%
83.45%(+25%)
个性化推荐
46.67%
76.36%(+64%)

用户事实召回这个指标最夸张,从不到 30% 涨到 79%。意思是以前你跟 AI 说过的十件事,它只能想起三件。

现在能想起八件。

除了 PersonaMem,项目还跑了几个编程相关的基准测试:

WideSearch 成功率 33%→50%,token 砍 61%;

SWE-bench 通过率 58.4%→64.2%,token 省 33%。

WideSearchp 评估信息任务中的搜索、整合与验证能力,SWE-bench 是一个用于评估人工智能模型解决真实世界软件工程问题能力的评测基准

加了记忆不光记住了更多,做任务效率也变高了,省下的 token 都用在干正事上。

05

怎么用

这个项目现在是作为 OpenClaw 的插件发布的,安装非常简单。

一行命令搞定:

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

装完之后默认使用本地 SQLite + sqlite-vec 作为存储后端,零配置,开箱即用。

不需要你单独装数据库,不需要连外部服务,数据全在本地。

如果你想接外部 Embedding 服务来增强语义检索效果,可以在配置文件里指定。

如果你用的是 Hermes Agent 框架,项目也提供了 Docker 一体化镜像。

把 Hermes + Agent Memory 插件 + Gateway 全打包在一个容器里,docker pull 下来就能跑。

支持的模型也很灵活。

新的 1.0.0-beta.1 版本给希望自己开发 Agent Memory 适配层的用户提供了快速开始的方法。

06

腾讯云数据库AI能力版图

TencentDB Agent Memory 不是腾讯云凭空搞出来的一个独立项目。它是 5 月 29 日腾讯云「数据库+AI」发布会的一部分。

这场发布会的主题叫 AI 原生·重构数据库新范式,核心思路是:当 Agent 成为新的生产力单元,数据库的使命就要从存数据演进为支撑智能体感知、记忆、决策与协作的数据底座

沿着 AI 原生数据库这这条线,腾讯云这次一口气发了好几样东西:

DatabaseClaw,腾讯云第一个数据库 Agent

跟普通的 AI DBA 助手不一样,它不只是回答问题,而是能真的进入生产环境承担运维职责,7x24 小时跑着。自动巡检、异常诊断、慢 SQL 归因,这些 DBA 日常最耗时间的事它都能干。

而且构建了四层安全防线,权限隔离、AI 行为护栏、架构安全、全链路审计,让DBA 敢把生产库权限交给它。

TDSQL Boundless,新一代分布式数据库

在一套统一的分布式架构上,支持关系型事务处理、向量语义检索与全文搜索等多种数据类型,多种访问模式多种模型数据在同一个连接、甚至同一个事务中完成,不用再为不同数据类型维护不同的数据库了。

TDSQL-C,云原生数据库全面升级

这次TDSQL-C重构的第三代存储架构 AI Native Storage主打三个字:稳、灾、省。

业务无感的存储组件发布和坏盘替换,带来的最终质变是:极致性价比,TCO 较同类产品下降 200%+;IO 零抖动,全链路无损变更;数据零丢失,3 AZ 金融级强同步、RPO=0。

依托第三代存储架构,TDSQL-C 还系统化升级为面向 AI 时代的双引擎云原生数据库,内核采用的是PG 与 MySQL 双引擎的云原生计算节点。

可一站式对接腾讯云 cloudbase 的 baas 平台以及 Cursor、FastGPT等这些AI 开发者应用,用 MCP、REST等协议实现统一接入。

这些产品放在一起看,腾讯云数据库在做的事情是:从底层的数据库引擎,到中间的记忆和运维能力,再到上层的AI开发体验,整套 Agent 时代的数据基础设施都在用AI原生的思路重构一遍。

而 Agent Memory 是其中跟开发者关系最近的一环:它直接解决了AI 怎么记住你这个所有人都会遇到的问题。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询