微信扫码
添加专属顾问
我要投稿
从提示词工程到循环工程,AI编程的新范式正在改变开发者的工作方式。核心内容: 1. 循环工程的核心概念与基本构成 2. 循环的五种演进形态与含义 3. 在生产环境中的应用实践与未来展望
原文:https://x.com/omarsar0/status/2068008743153832264
AI 编程圈里最近流传着一个说法:别再给你的编程智能体写提示词了,开始设计能替你给它们写提示词的循环。和所有新东西一样,这类说法经常被重复,却很少被解释清楚。本文是一个实用版本:什么是智能体循环,它为什么重要,以及它在生产环境中是什么样子。
下面是我在一些实验、研究,以及和我们的学生、技术创始人、AI 工程师和创业公司交流后的一些想法(在 Claude 的帮助下写成)。
你也可以把我们最近的直播 “Autonomous Long-Running Coding Agents” 作为理解这一切的良好起点。
“你不应该再给编程智能体写提示词了。你应该设计会提示你的智能体的循环。”Peter Steinberger(@steipete),2026 年 6 月 7 日。220 万次浏览。原推文
Claude Code 的创建者 Boris Cherny 从另一个角度表达了同样的观点。
“我现在不再提示 Claude 了。我有一些循环在运行。是它们在提示 Claude,并弄清楚该做什么。我的工作是编写循环。”Boris Cherny(@bcherny)。原推文
重点并不是说提示词工程已经死了。有了循环工程,工作会上升一个层级:从编写代码,变成编写那个会编写代码的系统。在这条路上走得最远的开发者表示,他们有些月份在没有打开 IDE 的情况下提交了数百个 PR,而且每一行代码都是智能体写的。
循环是你编写的一小段程序,它做四件事:
你不再坐在循环里手动输入提示词;你编写循环,而模型变成它调用的一个子程序。
它的形态始终相同:设定目标、执行、检查、把错误反馈回去,然后不断重复,直到检查通过,或者循环自行停止。
很多分歧来自于人们用同一个词指代五种不同的想法。下面是这个概念从旧到新的演进。
上面的演进解释了人们说“循环”时指的是什么;而这里讲的是一个循环由什么构成。同样的六个部分每次都会出现,而且现在其中大多数已经内置在编程工具里,而不再需要你维护自定义脚本。
把这六部分组装起来,你就有了循环工程的良好起点。过去你需要手工构建所有东西;现在大多数都已经作为内置功能提供,这也是这个模式从边缘技巧走向普遍使用的原因。
下面是一个你今天就可以构建的具体例子:
你回来时看到的是已经合并的 PR,而不是一堆构建失败的积压任务。同样的形态覆盖了大多数运维工作:
PR 看护员是一个你自己接线的循环;看看一个内置在智能体中的循环也很有帮助。在 Claude Code 中,最小的完整循环是 /goal:你给它一个可验证的最终状态,它会持续进行多轮操作,直到该状态为真。
下面是在 Claude Code 中把 /goal 作为会话内命令使用的例子。你启动会话,然后在其中设定目标:
bash
它与前面讲过的执行、检查、重复形态相同,只是验证器内置其中。
到这里已经很清楚了:一个强有力的 /goal 读起来不像提示词,更像一份合约。好的 /goal 会明确四件事:你想要的最终状态、证明你已经达到该状态的证据、智能体在实现过程中不得破坏的约束,以及允许它消耗的工作预算。其中任何一项含糊,模型都会用最省事的方式填补空白:它会过早停止、走捷径,或者重新定义成功,让转录记录看起来已经完成,而真实系统仍然是坏的。
状态会跨轮次携带,所以它不会过早退出,也不会中途丢掉某个约束。一些控制手段能让它更可靠:
评估器这一步隐藏了一个有用的细节:检查器不必和编码器是同一个模型。一旦循环有了不同角色(规划者、执行者、评估者、视觉审查者),每个角色都可以运行在不同模型上,而选择哪个模型承担哪个角色,会变成一个架构决策,而不是把赌注押在某个“最佳”编程智能体上。有些模型更擅长规划,有些模型执行成本更低,有些模型能更准确地判断截图,一个好的编排器允许你按角色替换它们,而不是等待某个厂商赢下所有类别。
它很适合 API 迁移(移动每个调用点,直到编译和测试通过)、重构(拆分文件,直到每个模块都低于预算)、issue 积压处理(处理带标签的队列,直到队列为空),以及评估循环(调整提示词,直到分数超过阈值)。/loop 是针对没有单一终点的工作的对应物:它不是设置完成条件,而是按计划重新提示,这正是 PR 看护员这类循环能持续运行的方式。
单个 /goal 循环是一个智能体朝着一个终点工作。运行多个无人值守进程会提高风险,因为循环的可信度取决于它检查自身工作的能力。Cherny 让 Opus 自主运行数小时的设置可以归结为五步:
完整序列:
bash
用一个具体工具来理解编排会更容易。Peter Steinberger 的 crabfleet 是 OpenClaw 的一个项目,被称为“智能体运行的任务控制中心”。它是一个被包装成产品的循环,其形态与上文所有内容都能对应起来。
它运行在一次性云沙箱上,并带有基于浏览器的终端,这让你放心离开无人值守运行成为可能。重点不是具体工具,而是循环已经硬化成了基础设施:队列、持久执行、扇出和人工审查门禁,现在都是你配置的东西,而不是每次都要手写脚本。
过去两年里,AI 编程中的成本问题很简单:用哪个模型,以及多少 token。在循环内部,这种直觉会指向错误的层级。支出不再是一次调用,而是循环转了多少圈,所以一个在收敛前重试六次的循环,和一个一次就成功的循环相比,即使使用同一个模型,成本也是六倍。
这会改变值得优化的东西:
过去你调提示词;现在你调循环,因为成本是在这里累积的。
当任务会重复,并且机器能够判断何时完成时,循环才有回报。除此之外,循环只是在自动化制造忙乱。以下情况请跳过:
一个在你睡觉时运行的循环,也会在你睡觉时犯错,而且失败模式是可预见的。
这些都不是反对循环的理由;它们说明了为什么设计循环的工程师更加重要,而不是更不重要。
要点是:现在昂贵且容易出故障的部分是循环,而不是模型。构建它时,要像一个仍打算对输出负责的工程师,而不只是那个启动运行的人。
如果你发现任何错误,或者有需要进一步澄清的地方,请随时联系。
如果你也对AI充满兴趣,欢迎加入我们的ThinkInAI社区,在这里,你可以:
扫描文末二维码,加入ThinkInAI社区,一起拥抱AI新时代!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-17
用 Claude AI 学会任何东西的 6 个万能提示词
2026-06-17
怎么写一份 Claude 真正能看懂的 DESIGN.md 文件?
2026-06-15
提示词工程已死,Loop Engineering来了!
2026-06-12
教你用 Codex 从 0 到 1 写一个 SKILL
2026-06-12
用Claude Code写PRD,我总结了这几条有用的经验!
2026-06-11
Anthropic 工程师:我不再写 Prompt 了,我写 Loop
2026-06-11
把提示词封装成skill!零成本雇佣一位Excel高手
2026-06-10
Harness 刚搞懂,Loop Engineering又要火了
2026-04-21
2026-04-07
2026-03-26
2026-03-26
2026-04-25
2026-05-02
2026-04-14
2026-04-19
2026-04-20
2026-04-14
2026-06-17
2026-05-23
2026-05-16
2026-04-14
2026-02-28
2026-02-12
2026-02-12
2026-02-08