微信扫码
添加专属顾问
我要投稿
揭秘ChatGPT记忆系统的黑箱操作,原来它比你想象的更简单! 核心内容: 1. ChatGPT记忆系统的六层上下文架构解析 2. 会话元数据与用户记忆的存储机制差异 3. 逆向工程发现的意外设计思路(无向量数据库)
大家好,许久未见,心中充满了思念。在这个不断变化的牛马世界中,每一天都有新的故事上演,繁忙而又充满激情。感谢大家的理解和支持。
最近看到一篇关于ChatGPT记忆系统逆向工程的技术分析,笔者觉得其中的架构设计思路对做对话系统和知识库问答的同学很有参考价值,今天就来深入聊聊这个话题。
码字不易,觉得有价值的话记得点赞、关注。
当你问ChatGPT"你记得关于我的什么"时,它可能会列出几十条关于你的信息——从名字、职业目标到健身习惯。这引发了一个技术问题:它是如何存储和检索这些信息的?
很多人的第一反应是:肯定用了向量数据库,肯定做了RAG。
但实际逆向分析的结论却出乎意料:没有向量数据库,没有对历史对话的RAG检索。 整个记忆系统的架构比想象中简单得多。
这篇文章的核心发现来自对ChatGPT行为的大量实验和对话分析,OpenAI并未公开这些实现细节。
通过逆向分析,ChatGPT每次接收消息时的上下文结构大致如下:
[0] System Instructions // 系统指令
[1] Developer Instructions // 开发者指令
[2] Session Metadata // 会话元数据(临时)
[3] User Memory // 用户记忆(长期事实)
[4] Recent Conversations // 近期对话摘要
[5] Current Session Messages // 当前会话消息
[6] Your Latest Message // 用户最新输入前两层定义高层行为和安全规则,技术上没有太多可讨论的。真正有意思的是从第三层开始。
会话元数据在每个session开始时注入一次,不会被永久存储,session结束后即丢弃。
包含的信息类型:
Session Metadata:
- User subscription: ChatGPT Plus
- Device: Desktop browser
- Browser user-agent: Chrome on macOS
- Approximate location: China (may be VPN)
- Local time: ~16:00
- Account age: ~157 weeks
- Recent activity:
- Active 1 day in the last 1
- Active 5 days in the last 7
- Active 18 days in the last 30
- Conversation patterns:
- Average conversation depth: ~14.8 messages
- Average user message length: ~4057 characters
- Device environment:
- Dark mode enabled
- Screen size: 900×1440这层信息的作用是让模型能够适配用户的使用环境,但不形成长期记忆。比如检测到移动端可能会生成更简洁的回复,检测到深色模式可能在代码展示时考虑配色。
ChatGPT有一个专门的工具用于存储和删除关于用户的稳定、长期事实。这些信息会在数周、数月内累积,形成持久化的用户画像。
触发存储的条件:
- 用户名字是张三
- 之前在某科技公司和某创业公司工作过
- 偏好通过视频、论文和动手实践相结合的方式学习
- 正在研究现代信息检索系统(LDA、BM25、混合检索、稠密向量、FAISS等)
- 健身习惯:每周跑步3次这些记忆被注入到每一次后续的prompt中,作为独立的上下文块存在。这意味着:
笔者原本预期ChatGPT会使用某种RAG机制来检索历史对话。但实际上,它用的是轻量级摘要。
ChatGPT维护一个近期对话摘要列表,格式如下:
1. <时间戳>: <对话标题>
|||| 用户消息片段 ||||
|||| 用户消息片段 ||||这是一个典型的precision-latency trade-off:用上下文精度换取响应速度和计算效率。
当前对话的完整历史(非摘要)会被传递给模型,这是维持会话连贯性的基础。
这意味着在一个长对话中,你可能会发现模型"忘记"了对话开头的内容,但它仍然记得你是谁、你的偏好是什么。
当你发送一条消息时,系统的处理流程是:
这个架构的关键思路是:不是所有信息都需要以"记忆"的形式存在。
四个组件各司其职,动态组合。
传统思路可能会想:为什么不直接对所有历史对话做RAG?
答案是成本和延迟的现实约束:
这是一个工程妥协,而非技术局限。
这套架构适合:
不适合:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-16
陈天桥丨系统的融化:从AI赋能到AI原生
2025-12-16
Google Disco:新型浏览器+Gemini3,信息不只是文字总结
2025-12-16
Claude MCP 和 Skills 的微妙关系
2025-12-16
会议软件Zoom也来搞AI了,称在AI最难考试上“击败”了Gemini 3
2025-12-16
深夜炸场!Manus 1.6 突然发布,史诗级进化暴力实测
2025-12-16
Prompt是与LLM对话的唯一方式:如何给大模型装上能指挥“手脚”的脑子?
2025-12-15
治理之智 | 从零和博弈走向长期合作:人工智能版权问题分析与思考
2025-12-15
AgentScope x RocketMQ:打造企业级高可靠 A2A 智能体通信基座
2025-09-19
2025-10-26
2025-10-02
2025-09-29
2025-10-07
2025-09-30
2025-11-19
2025-10-20
2025-11-13
2025-10-02
2025-12-16
2025-12-15
2025-12-14
2025-12-12
2025-12-12
2025-12-11
2025-12-09
2025-12-08