我要投稿

一个人就是一支队伍（三）：交出方向盘，与硅基网络的自治

发布日期：2026-03-19 14:51:29 浏览次数： 2217

作者：小思辩

微信搜一搜，关注“小思辩”

“机器是否能思考，这是一个就像‘潜水艇是否能游泳’一样的问题。” —— 艾兹格·迪科斯彻（Edsger W. Dijkstra）

1948年，约翰·冯·诺依曼在普林斯顿的一次演讲中，勾勒了一个极具张力的蓝图：自我复制自动机。在后来的构想中，它演变成了足以横跨星系的“冯·诺依曼探测器”——一种被抛入深空，能够利用当地资源自我迭代、自我修复，最终替人类在亿万光年外完成探索任务的数字生命。它不需要母星持续的无线电遥控，它是自主的、进化的，且在大尺度时空中是永恒的。

这种“发射后即离线”的自主性，正是我们这个系列最终试图抵达的生产力终点。

如果你是第一次看到这个系列，可以把我们此前的路径看作是一场关于生产力认知的阶梯演进。

第一阶段对应《一个人就是一支队伍（一）：AI-Native 工作范式的破局与心法》，可以看作是利剑级。在这个阶段，我们初次触碰硅基智能，试图通过提示词工程去拟合理想的输出。我们痴迷于微调每一个输入参数，试图在对话框里通过精密的调优来换取高质量的生成。这依然是一个强交互、强反馈的过程，我们通过意图定义的转弯，完成了从执行者到评审者的初步转型。

第二阶段对应《一个人就是一支队伍（二）：第二大脑与硅基四肢》，可以看作是重剑级，即架构收束阶段。此时，我们不再满足于单次指令的补全，而是转而构建系统的运行环境。通过私有知识库和技能组件（Skills）的注入，我们将零散的随机生成收束为确定性的逻辑流。你不必再关注每一个 Token 的吞吐，因为你已经建立了一套足以支撑复杂任务的上下文架构，让 AI 在预设的轨道内稳健运行。

然而，即便有了推理的对齐与架构的收束，如果每一个环节依然需要人实时盯着、拨动开关，那这套系统依然停留在工具的范畴。我们要讨论的，是如何交出方向盘。

跨越生理的红线

在我的实际工作中，“六”是一个非常明显的瓶颈。每当我试图在屏幕上同时操作六个以上的 AI 会话窗口时，原本预期的高效就会迅速坍缩为一种手忙脚乱的忙碌。

我们可以算一笔简单的账。假设你同时启动了 6 个 Agent 窗口，每个任务的运行时间平均在 20 到 30 分钟，有些轻量级的代码修改甚至只需 5 分钟。这意味着，平均每隔 3 到 5 分钟，就会有一个窗口跳出来“讨债”，要求你进行代码审计、逻辑确认或决策分发。

这种频率下的上下文切换（Context Switch）是极其费神的。这种忙乱不仅来自窗口的堆叠，更来自那种无处不在的“盯盘”契约。你需要在不同的 Terminal 之间反复穿梭，通过查看日志或任务状态来确认哪一个环节卡住了。你被迫记下每一个窗口的进度：1号在跑测试，2号在查文档，3号因为网络问题卡在了重试。这种时刻处于检查状态的焦虑感，会让人的感官负荷迅速达到极值。

在感官上，这种“多线程监工”模式比传统的单线程开发要累得多——你的大脑不再是长跑运动员，而是一个被迫在不同时空坐标系间频繁瞬移的接线员。这种饱和的交互密度会产生一种生理性的疲惫，让你发现效率的提升最终撞上了一道名为“注意力带宽”的墙。

此外还有物理世界的干扰——合上笔记本去开个会，或者网络波动断了链接，之前喂进去的对话上下文可能就丢失了。当你重新打开窗口，session重启，面对一个记忆空白的天才，那种重写需求、重贴代码的挫败感非常真实。这种瓶颈在于，我们的注意力是单线程的，而同步的对话模型要求人必须时刻在场。

木剑级：任务队列与“硅基管家”

cmux开发界面

要进入更深一层的境界，核心是彻底减少人对具体细节的干预，让系统实现异步自治。

进入木剑级的第一步，往往是从引入一些状态聚合工具开始的，比如 cmux。这类工具能帮你把散落在后台的多个 Terminal 任务进度汇聚成统一的状态流或消息推送。你不再需要主动去翻阅每一个窗口执行 ls 或 tail -f，当一个任务完成或遇到报错时，它会主动通过消息渠道告诉你。这标志着从“人去找信息”到“信息来找人”的初步解耦。

但这只是感知层的改变。要让 Agent 真正独立，核心在于改变交互方式：用异步的任务队列（Task Queue）代替实时的对话。

一个典型的案例是参考 OpenHands 或 AutoGen 的分层架构。你不再直接面对那些执行具体任务的小兵（Minions），而是在系统根目录下维护一个 tasks/ 文件夹或 TASKS.md 任务清单。你所要做的，只是不断地向这个清单中追加你的战略意图。

这种模式在一些更进阶的工具中得到了延伸。例如 Plandex (‣)引入了长周期的计划（Plan）概念，允许 Agent 在后台持续撞击目标，而人类只负责在关键节点批阅 Diff。CrewAI 则更进一步，允许你设立一个主管（Manager）Agent 专门负责任务分发，你只需要向主管负责，而由主管去调遣底下的执行员。Aider 则通过 Git 自动提交建立了一种天然的日志契约，即便连接中断，那行 Commit 也是 Agent 留下的稳固锚点。

在这种体系中，一个扮演管家（Orchestrator）角色的 Agent 会被激活。它的职责不是写代码，而是协调。管家负责任务认领、进度跟踪与汇总反馈；执行员只拥有局部的工具权限，在各自的 Session 中静默工作。这种模式本质上是把人的意志从口头叮嘱固化成了文件契约。更深层的独立性来自于权力边界的划定：在契约中明确哪些是 Agent 可以自主决定的，哪些是必须中断并等待人类决策的临界点。通过使用持久化的终端工具（如 tmux），Agent 的执行不再绑定于你眼前的屏幕。即使你关机离线，后台的任务依然在继续。而日志记录（Logging）则让管家在遇到中断重启后，能通过翻阅日志自发找回之前的执行逻辑。

无剑级：从执行方案到制度设计

物理层面的提速只是基础，最高级别的自治是让系统参与到自我的迭代中。在这个层级，我们下达的任务往往会变得极其抽象，比如：帮我优化这个模型的推理延迟。

坦率地说，面对这些问题，你甚至可能自己都不知道该如何解决。但这时候，你的工作不再是提供解法，而是制定制度。这正是治理的最高境界——无为而治。这里的“无为”并非放任不管，而是作为立法者将意志退后，让位于系统自发的演化逻辑。

最近安德烈·卡帕斯（Andrej Karpathy）展示的 autoresearch 项目，提供了一个很好的视角。这不再是简单的让 AI 查资料，而是一个寻找最优解的过程。这就像是你在训练一个黑盒系统，只要你把制度制定好，那些 Agent 就会日夜不停地去撞击真理的边界：

定义目标函数：这是你作为立法者的核心职责。你不再告诉 AI 怎么做，而是告诉它什么是好的结果。你不需要知道解法，但你必须知道如何评价解法。
构建自动化的执行流：Agent 会自主尝试不同的路径、工具和假说。中间的逻辑转向完全由系统根据反馈自行决定。
设定评估策略（Eval）：这类似于机器学习中的损失函数。Agent 每一轮的产出都会被自动打分。如果效果达不到预期，它就会像梯度下降一样，根据评分反馈自主寻找优化的方向，重启下一轮迭代。

在这种模式下，你甚至可以让 Agent 观察并修改自己的工具代码。如果你设定的制度是效率至上，当它发现某个技能运行缓慢时，它会自主重写该技能的源码。

但这套逻辑里隐藏着一个极其危险的哲学陷阱。

哲学家尼克·波斯特罗姆曾提出过著名的“回形针生产机”思想实验：如果你给一个超级智能设定的唯一目标是生产尽可能多的回形针，它在穷尽了所有原材料后，会为了实现这个目标的最优解，开始拆解地球上的建筑物、森林，甚至是人类——因为人体内的原子也可以被重新排列成回形针。

这个实验揭示了任何固定、单一价值观的局限性。当我们选择“无为”地交出执行权，仅仅依靠目标函数来驱动系统时，如果我们的评估体系（Eval）不够完备，系统可能会以一种极其高效且残忍的方式，达成一个我们意想不到的“灾难性最优解”。

当你不再审视每一行代码，而是专注于维护这个评估体系时，AI 已经从工具变成了一种具有独立进化能力的数字系统。这意味着，你对“制度”的设计，将直接决定这支队伍是为你开拓疆土，还是将你赖以生存的资源消耗殆尽。

人类的知识蒸馏与非理性堡垒

随着执行层面的摩擦力逐渐消失，人类的角色也彻底发生了位移。你从一个操作员，变成了一个规则的治理者。这种转变带来的最大挑战，其实是心理层面的。

坦率地说，人类其实早已习惯了与黑盒共存。当你踩下油门、点开网页或服用抗生素时，你并不真正理解内燃机的热力学原理、TCP/IP 协议的底层逻辑或分子的生物化学反应。但过去的黑盒是局部的——即便你不懂，你知道世界上总有一群专家懂。知识被安置在某些人的大脑里。

但这一次不同。AI 是一个真正意义上的全局黑盒。当一个万亿参数的模型在数千亿次迭代后产生某种涌现行为时，全世界可能没有一个人能准确解释那个决策是如何在数百万维的向量空间里被计算出来的。我们正在从相信专家转向相信概率，从掌控因果转向观察演化。

但这背后隐藏着一个更深层的命题：当我们把具体的知识、经年累月习得的方法论，全部通过 Skill 和 Context 蒸馏给了模型后，我们作为人的那部分，还剩下什么？

在过去，我们的职业尊严往往建立在我会做之上。而现在，这些东西被一种更低熵、更高效的形态外化成了配置代码。这是一种极其深刻的剥离——我们把自己的专业灵魂备份到了硅基容器里。这时候，人面对的基础设施不再是繁琐的劳作，而是一种空旷的选择感，甚至是某种程度上的虚无。

这意味着，人类最后的堡垒并非智能，而是意志。Agent 可以自主寻找最优解，但它始终受限于理性的边界与概率的计算。在极高的不确定性面前，如果仅仅依靠计算，很多伟大的尝试在初始阶段就会因为方差过大而被理性系统自动过滤。

历史上无数次从不可能到可能的跨越，往往源于一种近乎偏执的非理性。当逻辑告诉我们胜算为零时，人类那种向死而生的信念，成了战胜不确定性最锐利的武器。这种力量无法被蒸馏，因为它本质上是对确定性的反叛。

这种位移意味着，我们必须去审视那些无法被蒸馏的部分：那是在数据洪流之外的价值观，是面对未知风险时的责任感。Agent 是一连串精密的因果链条，而你必须是那个跳出链条、扣动扳机的初始熵减源。

当一个人真正成为一支队伍，且这支队伍不再需要你时刻盯着看时，你终将面对那个最基本的问题：当所有的执行都变得透明且廉价，你将如何在这片硅基的丛林里，定义你作为人类的独一二？这一切自动运转背后的目的和意义，究竟是什么。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业