2026年6月25日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

用 Schema 约束智能体记忆

发布日期:2026-06-25 11:36:33 浏览次数: 1526
作者:NanoAgent

微信搜一搜,关注“NanoAgent”

推荐语

这篇文章探讨了如何用Schema规范智能体记忆系统,避免信息膨胀与结构混乱,提升知识图谱的可用性。

核心内容:
1. 传统智能体记忆系统的规模膨胀与结构问题
2. 基于Schema约束的实体、关系与时间解析方法
3. 从最小Schema开始建模并逐步优化的实践路径

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

用 Schema 约束智能体记忆

记忆系统规模膨胀

大多数智能体系统都把记忆作为优化目标,通常需要考虑的问题是如何限制记忆的规模,或者更准确地说,如何从一开始就避免存储不该存储的信息,而不是基于LLM识别的记忆内容无限制的膨胀。

默认的智能体记忆流水线会向 LLM 提供原始文本,并要求 LLM 提取实体与关系,然后模型会自行决定实体类型、标签和属性。

img

最终得到的知识图谱也无法投入生产使用。实体类型退化为泛化标签,关系被扁平化为单一的 RELATES_TO。图谱里确实包含数据,但任何查询都很难精确命中需要的信息。


先定义约束,再写入记忆

这并不是单纯的检索问题,而是结构问题。解决方法与 AI 技术栈中许多环节已经验证过的模式一致:在生成之前约束生成空间,而不是在生成之后再修补结果

实体定义了智能体可以记住什么。带有类型化字段和描述性文档字符串的 Pydantic 模型,可以用明确的领域词汇表替代 LLM 的自由猜测。
边定义了实体之间允许建立什么关系。关系类型的源节点/目标节点约束意味着图谱只能形成有效连接。如果 Schema 中没有连接“项目”和“竞争对手”的边,这类关系就无法写入记忆。
时间解析用于区分过去为真的事实与现在仍然为真的事实。事实消解则会让过期关系失效,同时保留历史记录,因此图谱不会在无声无息中停留在过时状态。

Pipeline 的关键抽取环节

这种基于Schema的记忆系统会引导 Pipeline 中两个关键环节:实体抽取事实抽取。可以自定义系统需要查找和记住的内容,解析、去重、冲突检测和时间窗口处理可以在下游自动完成,而不是让模型在开放空间里自由发挥。

img

从最小 Schema 开始

⚡ 建模约束

一个有用的约束是:限制实体类型数量,限制边类型数量,限制每种类型的字段数量。

这种schema约束的记忆系统迫使你只为真正重要的 80% 信息建模,而不是追求一开始就覆盖所有情况。先从最简单的 Schema 开始,只有当实际检索或召回失败时,再考虑扩展实体、关系或字段。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询