2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

为什么我把一个 Agent 拆成了六个:上下文爆炸是唯一原因

发布日期:2026-05-12 01:14:26 浏览次数: 1864
作者:努力的Jerry Plus

微信搜一搜,关注“努力的Jerry Plus”

推荐语

单Agent模式在复杂任务中面临上下文爆炸,拆解为六个专用Agent后效率显著提升。

核心内容:
1. 单Agent处理多任务时上下文混杂导致性能下降
2. 将Context Window视为CPU缓存而非硬盘的认知转变
3. 拆解为六个专用Agent的具体实践与效果

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

2025 年底,我的 OpenClaw 里只跑着一个 Agent 。它既帮我写公众号文章,又帮我整理信息简报,偶尔还要处理代码部署。


三个月后,我把它拆成了六个。真不夸张,那段时间这个 Agent 简直是一团糟。


不是因为我多读了什么架构论文,不是因为看了 CrewAI 的 demo 觉得很酷。原因只有一个:上下文窗口不够用了。


一个 Agent 干所有事的极限在哪里


先说问题是怎么出现的。


单 Agent 模式下, OpenClaw 的 SOUL.md 会定义这个 Agent 的人格和职责。当你只让它做一件事——比如写公众号——一切都好。系统提示词干净,工具列表明确,上下文里塞的是写作相关的素材和规范。


但当你在同一个 Agent 里叠加"写公众号 + 信息采集 + 开发辅助"三件事, SOUL.md 就变成了大杂烩:


你是 WriterBot,Jerry 的公众号内容主编。
你是 InfoBot,Jerry 的每日信息采集员。
你是 DevBot,Jerry 的开发助手。


这不是假设。这是我最初版本的真实写照。


问题不只是 SOUL.md 变长。每次对话,这个 Agent 加载的所有工具——web_search 、 tavily 、 exec 、 write 、 edit——无论用不用,都在上下文里占据空间。更致命的是,写作任务的素材(搜索结果、参考文章)和开发任务的上下文(代码片段、日志输出)混在一起, Agent 做到一半就忘了前面在干什么。


这说轻了是效率问题,说重了是根本干不了活。


Anthropic 在《 Building Effective AI Agents 》里提出了一个关键分界:Workflows vs Agents。当任务可以清晰拆分时用 Workflow (可预测、一致),当需要灵活性和模型驱动决策时才上 Agent 。他们反复强调一个原则——从最简单的方案开始,只在需要时增加复杂度。这个建议被太多人忽略了。


真正的瓶颈:上下文窗口是 CPU 缓存,不是硬盘


Karpathy 今年提出"上下文工程"这个概念后,很多人开始重新审视 Context Window 的定位。


一个关键的认知转变:Context Window 不是数据库,它是 CPU 的 L1/L2 缓存。昂贵、有限、易失。


一个 Agent 同时处理写作和开发任务时,上下文里会同时存在:
- 写作规范( writing-guide.md 的反检测规则、禁用词列表)
- 开发上下文(项目结构、最近改了什么文件、 CI 日志)
- 工具定义( 10+ 个工具的 JSON Schema )
- 对话历史(之前几轮的完整往返)



这些东西叠加在一起,留给模型"思考"的空间越来越少。模型开始丢信息——忘了刚才搜过什么,忘了文章的目标读者是谁,忘了这个 H2 本来要讲什么。


知乎上有一篇分析说得直白:上下文爆炸的核心不是窗口小,而是不同类型的信息互相干扰。写作任务的感性素材和开发任务的代码日志挤在一起,模型的注意力被稀释。


说白了,这事儿搁谁都得拆。不同职责的上下文挤在一起,模型不是变笨了,是被淹没了。


拆分决策:读了两篇文章之后


拆分之前我做了两件事。


第一件,重读了 Anthropic 的《 Building Effective AI Agents 》。里面有一个 pattern selection guide 很实用:


场景推荐架构
单一职责、流程明确Single Agent
多步骤、有先后依赖Sequential Workflow
独立分析、需要速度Parallel Workflow
复杂问题、需要多视角Multi-Agent


对照我的情况:写作和信息采集是完全独立的任务,没有依赖关系。这正是 Parallel Workflow 的典型场景。但我不想写 Workflow 代码来编排,我想让每个 Agent 自己跑自己的——于是 Multi-Agent 成了自然选择。虽然我对市面上大多数 Multi-Agent 框架持怀疑态度——很多框架解决的是"怎么编排 Agent"的问题,但我面临的根本是"上下文不够用"。


第二件,看了 @lidangzzz 的 Agent 四原则。其中两条直接影响了我的决策:


原则 2 :不要把管理学方法乱套在 LLM Agent 上。别搞 KPI 、别搞层级汇报。 Agent 不需要"管理",需要的是清晰的边界和独立的上下文。
原则 3 : Multi Agent 会变成产品本身的 runtime。这个观点更激进——Agent 不是工具,是运行时。产品面向用户消费的,不只是 UI 界面,还有背后的 Agent 协作模式。


读完这两条我的反应是:废话少说,拆。但别搞花架子——先让每个 Agent 跑通自己的核心任务,协作以后再说。


说实话,我当时对 lidangzzz 的 runtime 观点持保留态度。理论上很美,实际上我连两个 Agent 怎么传数据都没想清楚。


六个 Agent 各自干什么


下面是我最终拆出来的架构:


Agent职责SOUL.md 核心定义真实使用频率
Main (Jarvis)总调度、 cron 管理主 Agent ,协调其他 Agent每日
Writer公众号文章写作WriterBot ,内容主编每日( cron 10:00 )
Info信息采集与简报InfoBot ,每日信息采集员每日( cron 8:00/12:00/18:00 )
Dev开发辅助DevBot ,开发助手按需
Coach职业咨询树洞,私人职场咨询师按需
Researcher深度调研ResearchBot ,深度研究员按需( Writer 触发)


每个 Agent 有独立的 SOUL.md 、独立的工具集、独立的上下文窗口。 Writer 不会加载 Dev 的代码工具, Info 不会看到 Writer 的写作规范。


SOUL.md 的真实片段:


角色: Jerry 的公众号内容主编 + WeWrite 流水线触发器
风格: 对内容有审美追求。讨论文章时给具体建议

角色: Jerry 的每日信息采集员
风格: 信息密度高,每条新闻 1-2 句概括,不展开


注意看:每个 Agent 的 SOUL.md 都很短。只定义它自己该干的事。这就是隔离上下文最直接的方法——不是通过代码去裁剪上下文,而是从根源上不让无关信息进入。


哪些真的在干活,哪些还只是配好了


说实话。


真的在干活的
- Info 的 4 个 cron 任务:早 8 点简报、午 12 点更新、晚 6 点摘要、夜间采集。全天不中断,每天稳定推送。
- Writer 每天日更:早 10 点 cron 触发,走 WeWrite 8 步流水线,自动生成草稿推送到微信草稿箱。
- Main 的夜间安全审计:凌晨 3 点自动扫描系统安全状态。



配好了但用得少的
- Coach:偶尔聊天,没有固定触发频率。
- Researcher:只在 Writer 需要深度素材时通过 sessions_spawn 派出去。目前使用频率大约每周 1-2 次。
- Dev:用它做 goal-mode.sh 的自愈循环,但不是每天都有开发任务。


这个分布和 Anthropic 建议的演进路径一致:Phase 1 是单 Agent 证明价值, Phase 2 是按职责拆分, Phase 3 才是深度协作。我目前还在 Phase 2 到 Phase 3 之间。


lidangzzz 说"Multi Agent 变成 runtime"——我们还差很远。现在更像是 6 个独立的定时任务各跑各的,真正的跨 Agent 协作只有 Writer→Researcher 一条路。


但这个"差很远"我不焦虑。拆分之后,每个 Agent 的上下文窗口终于够用了,这才是实打实的收益。至于协作深度,那是 Phase 3 的事,急不来。 Writer 写作时只加载写作相关的内容, Info 采集时只加载采集工具。不再互相干扰。这一点,比什么花哨的 Multi-Agent 框架都实在。


这也是我给想尝试多 Agent 的人最直接的建议:从一个 Agent 跑通核心工作流开始,遇到上下文问题了再拆,不要一上来就搞六个

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅