我要投稿

OpenClaw 为什么越用越好用？本质就是一堆 md 文件

发布日期：2026-04-03 08:40:47 浏览次数： 2004

作者：阿里云开发者

微信搜一搜，关注“阿里云开发者”

最近深度使用了 OpenClaw，基本上每天都要跟它交流几个小时，也慢慢摸索出了一些经验。看到不少人说 OpenClaw 不好用，我想先聊聊"不好用"的原因，再深入拆解一个我认为被大多数人忽略的核心问题——OpenClaw 越用越好用的本质到底是什么。

先说结论：是一堆 md 文件。

这不是调侃，是我读完它的源码之后得出的判断。下面展开说。

一、为什么很多人觉得 OpenClaw 不好用

在聊核心机制之前，先排除几个常见的"用法问题"。很多人说不好用，其实不是产品的问题，是使用姿势没对。

1. 模型没选对

模型对效果的影响是决定性的。同样的指令，换一个模型，输出质量可能天差地别。

这里的关键认知是：OpenClaw 本身不生产智能，它是一个让 AI 模型发挥得更好的框架。框架再好，底层模型不行，上限就在那里。就像你给一个实习生写了一份非常详尽的操作手册，他可能还是做不好；但你给一个高级工程师同样的手册，他能做到远超你预期的水平。

2. 把 Agent 当成通才

很多人的用法是：配一个 agent，什么都让它干。写代码找它，写文案找它，做数据分析还找它。

仔细想想，现实世界里是不是每个公司都分岗位？每个专家都专精一个或几个领域？AI agent 也是一样的。

OpenClaw 支持多 Agent 架构，你可以配置多个 agent，每个负责一个领域。而且从代码层面来看，这不只是"分工"那么简单——每个 agent 有独立的 workspace 目录、独立的 memory 数据库、独立的 session 历史。也就是说，一个专门做代码审查的 agent，它积累的所有经验都是关于代码审查的，不会被你让它帮你写周报的那些对话污染掉。

这就像一个公司里，让每个员工专注一个领域，他的经验积累是垂直的、深度的，而不是水平的、稀薄的。

3. 没有"培训"你的 Agent

这是今天我要重点展开的部分。

很多人装好 OpenClaw，开箱就用，觉得效果一般，然后就下了结论说不好用。但你想想，你招一个新员工，他第一天来上班你就指望他跟干了三年的老员工一样好使？

Agent 需要培训。需要跟它多对话，告诉它你的偏好，让它了解你的工作场景，跟它一起踩坑然后把经验固化下来。这个过程，用 OpenClaw 的术语叫"形成 SOP"，用更技术的话说，叫积累 workspace 文件。

这就是 OpenClaw 越用越好用的核心机制，也是这篇文章的重点。

二、核心机制：一个自我进化的 md 文件系统

我去读了 OpenClaw 的源码，把整个"越用越好用"的机制拆解清楚了。说白了，它的架构可以用一句话概括：

每次对话前，把一堆 md 文件拼进 prompt；对话后，让 agent 把新学到的东西写回这些 md 文件。

就这么简单。但这个简单的循环，构成了一个威力巨大的飞轮。

骨架：7 个核心 md 文件

OpenClaw 给每个 agent 的 workspace 预设了 7 类核心文件：

1. SOUL.md — Agent 是谁

这个文件定义了 agent 的人格：语气、风格、边界、价值观。有意思的是，模板里写着一句话："This file is yours to evolve. As you learn who you are, update it."——这个文件是你自己的，随着你了解自己，去更新它。

也就是说，agent 的"人格"不是你一次写死的，是它在跟你互动的过程中，自己慢慢调整的。它发现你喜欢简洁直接的回答，就会把这个偏好写进自己的灵魂文件里。

2. USER.md — 用户是谁

这是 agent 对你的画像：你的名字、时区、工作习惯、技术偏好、沟通风格。每次对话中 agent 了解到关于你的新信息，就会更新这个文件。用得越久，这个画像越精准，agent 就越"懂你"。

3. AGENTS.md — 做事的规矩和踩过的坑

这是最关键的一个文件。它定义了 agent 的行为规范，更重要的是，记录了所有踩过的坑。

我在源码里看到它的模板有一条明确的指令："When you learn a lesson → update AGENTS.md"、"When you make a mistake → document it so future-you doesn't repeat it."

翻译成人话就是：你犯了一个错，把它记下来，这样以后的你就不会再犯。

这就是为什么 OpenClaw 越用越好——不是因为模型变聪明了，是因为 AGENTS.md 里的踩坑记录越来越多。每一条记录都是一次错误的代价换来的经验，被固化成了一行文字，从此永远生效。

4. TOOLS.md — 环境备忘

记录你的工作环境：SSH 主机名、摄像头设备名、文件路径习惯等。agent 踩坑后自己补充。

5. SKILL.md × N — 各领域的操作手册

每个 SKILL.md 定义了一个特定领域的操作规范。OpenClaw 内置了 52 个 skill，涵盖 GitHub issue 管理、邮件处理、健康检查、代码审查等。

更关键的是，你可以自己写 skill。比如你每周都要出一份特定格式的周报，你可以把格式要求、数据来源、输出模板写成一个 SKILL.md，放到 workspace 里。从此 agent 每次做周报都会按照这个规范来，不需要你每次重新描述。

Skill 的加载有优先级：内置的优先级最低，workspace 里用户自定义的优先级最高。也就是说你可以覆盖任何内置 skill 的行为。

6. memory/*.md — 日常记忆

Agent 每天会写一个日期命名的 md 文件，记录当天的对话要点、做了什么、学到什么。这些文件会被索引到 SQLite 数据库里，支持全文搜索和向量检索。

7. MEMORY.md — 提炼后的长期记忆

Agent 会定期把 daily memory 里的重要内容提炼到这个文件里。相当于从日记中整理出来的笔记精华。这个文件每次对话都会被加载进 prompt，所以 agent 的"长期记忆"就存在这里。

血肉：用户和 Agent 共同生长出来的自定义文件

以上 7 类文件是框架预设的骨架。但 workspace 本质就是一个普通文件夹，agent 有文件读写能力，它可以在里面创建任何它需要的文件和目录。

比如一个帮你管理项目的 agent，用久了它的 workspace 里可能长出这样的结构：

workspace/├── SOUL.md├── USER.md├── AGENTS.md├── TOOLS.md├── MEMORY.md├── memory/│   ├── 2026-03-01.md│   └── 2026-03-02.md├── projects/│   ├── project-alpha/│   │   ├── progress.md│   │   ├── decisions.md│   │   └── risks.md│   └── project-beta/│       └── progress.md├── templates/│   ├── weekly-report.md│   └── meeting-notes.md└── contacts/    └── team-preferences.md

这些额外的文件没有任何 schema 约束，完全是 agent 在使用过程中自己组织出来的。每个人的 agent 最终长出来的形态不一样，取决于你跟它聊了什么、做了什么、在哪些领域用它。

这意味着你的 agent 是真正"私人定制"的——不是你在设置页面勾选了几个选项，是它通过几百次对话，自己生长出了一套只适合你的知识体系。

三、自我进化的闭环

上面说的都是静态的文件结构，真正有意思的是这些文件是怎么被维护和更新的。OpenClaw 设计了一个 agent 自我进化的闭环：

对话开始  → 加载 workspace 所有核心 md 文件到 system prompt  → agent 根据用户问题，先 memory_search 检索相关记忆  → agent 执行任务  → 任务中学到新东西 / 犯了错 / 发现了用户新偏好  → agent 写回相关文件（AGENTS.md / USER.md / memory/*.md / MEMORY.md）  → 文件变更触发 Memory 索引重建（SQLite FTS5 + 向量索引）  → 对话结束
下次对话开始  → 加载更新后的 md 文件  → 搜索到新索引的记忆  → agent 行为更精准  → 循环

注意这里面有两层循环：

外层循环：md 文件读写。每次对话加载，对话中更新。这是"经验"层面的积累——agent 知道了哪些事该做、哪些事不该做、你喜欢什么、你的环境是什么样的。

内层循环：向量索引检索。当 memory 文件越来越多，agent 不可能把所有内容都塞进 prompt（有 token 限制），所以 OpenClaw 用 SQLite 的 FTS5 全文搜索和 sqlite-vec 向量检索做了一个混合搜索引擎。agent 每次对话前被指令要求先搜索相关记忆再回答，这样即使积累了几百个 memory 文件，也能精准找到相关的信息。

两层循环合在一起，就是一个完整的"学习-记忆-检索-应用"系统。而这个系统的存储介质，全是 md 文件。

四、技术实现的几个关键细节

为了让这篇文章不只是概念层面的讨论，我从源码里挑几个具体的实现细节，帮助大家理解这套机制到底有多"实"。

Bootstrap 加载机制

每次对话开始，resolveBootstrapContextForRun() 函数会：

1.读取 workspace 下所有核心文件

2.根据会话类型过滤（子 agent 只加载精简子集）

3.允许插件通过 hook 修改内容

4.每个文件限制 20KB，总量限制 150KB，超出部分截断

这个预算机制很重要——它意味着你的 md 文件不能无限膨胀。写得太多太杂，反而会被截断。所以 agent 需要学会"提炼"，把最重要的经验浓缩在有限的空间里。这也是为什么 MEMORY.md（提炼后的长期记忆）和 memory/*.md（原始日记）要分开的原因。

Memory 混合搜索

memory 搜索引擎用了 70% 向量相似度 + 30% 关键词匹配的混合权重，还支持 MMR（Maximal Marginal Relevance）多样性和时间衰减。也就是说最近的记忆权重更高，而且搜索结果会尽量多样化，不会全是相似的内容。

Skill 发现的优先级链

Skill 从 6 个来源扫描，优先级从低到高：

1.插件提供的 skill

2.内置 skill

3.托管 skill（~/.openclaw/skills/）

4.个人 skill（~/.agents/skills/）

5.项目 skill（{workspace}/.agents/skills/）

6.Workspace skill（{workspace}/skills/）

用户 workspace 里的 skill 优先级最高，可以覆盖任何内置行为。这意味着你完全可以"调教"agent 的任何技能，而调教的方式就是——写一个 md 文件。

自毁式引导

首次使用时，agent 会执行 BOOTSTRAP.md 里的引导流程来设置 IDENTITY.md、USER.md、SOUL.md。设置完成后，agent 被指令要求删除 BOOTSTRAP.md 本身。这是一个一次性的初始化过程，完成后就不再需要了。workspace 的状态机会记录引导完成的时间戳。

五、这意味着什么

理解了这套机制之后，有几个推论：

1. 你的 Agent 的价值在 workspace 文件夹里

代码是公开的，模型是通用的。真正属于你的、不可替代的部分，是你 workspace 里那堆 md 文件。那些文件里编码了你的偏好、你的工作流、你踩过的坑、你的项目上下文。

换台电脑，把 workspace 文件夹拷过去，体验原封不动。删掉那个文件夹，一切从零开始。

2. 调教 Agent 就是写 md

不需要学编程，不需要理解 prompt engineering 的技术细节。你只需要用自然语言把你的经验、偏好、规范写成 md 文件，放到 workspace 里就行了。OpenClaw 的代码会自动把它们在合适的时机注入到 prompt 中。

甚至你不需要自己写——你跟 agent 对话的过程中，它自己就会把学到的东西写成 md。你要做的只是在它犯错时纠正它，它会自己记住。

3. Agent 之间的差距就是 md 文件的差距

两个人用同样版本的 OpenClaw、同样的模型，体验可能天差地别。差别就在于他们各自 workspace 里积累了什么。一个人用了三个月，workspace 里有几十个 skill、上百条踩坑记录、完善的用户画像；另一个人刚装上，workspace 只有默认模板。

这跟现实世界的专家差距是一样的——两个人智商差不多（模型一样），差距在于积累的经验和知识（md 文件）。

4. 这可能是 AI Agent 产品的通用范式

OpenClaw 做的这套"md 文件即知识"的架构，我觉得是有普适性的。任何 AI agent 产品，如果想要做到"越用越好用"，最终都要解决知识持久化和检索的问题。OpenClaw 的答案是用最朴素的文件格式（markdown）、最通用的存储方式（文件系统）、最直觉的组织方式（文件夹），再加上一个搜索引擎把它们串起来。

没有花哨的知识图谱，没有复杂的向量数据库集群，就是一堆 md 文件。但这堆 md 文件承载的是一个不断进化的专家系统——它知道你是谁、你要什么、怎么做你的事、哪些坑不能踩。

六、实操建议

最后给几个实操层面的建议：

主动引导 Agent 形成 SOP。不要等 agent 自己慢慢摸索，在你已经有成熟工作流的领域，直接告诉它"以后这类任务都按照这个流程来"，让它写成 SKILL.md。
定期审查 workspace 文件。 Agent 自己写的东西不一定都对，定期看看 AGENTS.md、USER.md 里有没有过时或者不准确的内容，及时修正。
善用多 Agent。不同领域配不同 agent，让每个 agent 的知识积累保持垂直和纯粹。一个专做代码的 agent 比一个什么都做的 agent 好用得多。
选对模型。再说一遍，模型是基础。一堆精心打磨的 md 文件喂给一个弱模型，效果也有限。
备份你的 workspace。这是你最有价值的数字资产之一。建议用 Git 管理（OpenClaw 默认就是 Git 跟踪的），定期推到远程仓库。

结语

OpenClaw 的源码有几十万行，但让它"越用越好用"的核心机制，说穿了就是一个 md 文件的读写循环。代码提供了管道——渠道接入、模型调用、工具执行、memory 索引。但流过管道的水，是那些不断积累的 md 文件。

换句话说：代码决定了 OpenClaw 能做什么，md 文件决定了它做得多好。

而后者，是你和你的 agent 一起，一次对话一次对话攒出来的。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业