我要投稿

Karpathy：AI编程已质变，就从去年12月开始

发布日期：2026-02-27 05:25:55 浏览次数： 1911

作者：量子位

微信搜一搜，关注“量子位”

2025年12月以前的AI编程，跟12月以后的AI编程完全是两码事了。

这一最新判断，来自Vibe Coding的提出者Karpathy。

很难说清楚过去两个月里，编程这件事因AI起了多大变化。
这种变化不是逐步发生的，而是在去年12月发生的突变。

作为最积极拥抱AI Coding的程序员代表人物之一，Karpathy甚至坦承：在去年12月之前，Coding Agent虽说也有亮眼表现，但实际上“基本没啥用”。

不过12月以后，一切都变了：模型质量显著提升，具备更强的长期一致性和韧性，能够完成大型的、耗时的任务。可以说，这种变化已经足以颠覆传统的编程工作流。

此言一出，再次说到了一众程序员的心坎上，帖子流量接近100万+的同时，大家纷纷表示：完全同意。

著名程序员、Ruby on Rails作者David Heinemeier Hansson就赞同道：

这是我40年玩计算机的历程中，见过的最大、最快的变化，也是最有趣的的变化。

而Karpathy自己在上个月发表的一个观点也被大量引用：

现在，最热门的新编程语言是英语。

软件开发正在经历根本性重构

Karpathy举了他自己的一个例子来说明这种变化。

周末他想在家里搭一个分析监控视频的仪表盘，于是他告诉Coding Agent：

这是我的DGX Spark的本地IP和用户名/密码。登录后，设置SSH密钥，安装vLLM，下载并测试Qwen3-VL，设置一个用于视频推理的服务器端点，创建一个基础Web UI仪表盘，测试所有功能，用systemd配置服务，记录内存使用的相关笔记，并为我写一份Markdown格式的报告。

接下来，他就放手让Agent自己干了。

结果Agent还真没让他多插手：30分钟，从写代码，到测试调试，到设置服务，再到写报告，全都搞定了。

这个过程中，Agent当然也不是没遇到问题，但它全都自己上网一个一个研究解决了。

这些工作放到三个月前，常常需要花费我一整个周末的时间。但现在，我只需要启动任务，放下它去做别的事，30分钟后回来接收成果。

Karpathy总结说：

编程正在被重构。在编辑器里输入计算机代码的时代已经结束。现在，你要做的是启动AI Agents，给它们下达任务，并同时管理和审核它们的工作。
最需要做的是弄清楚如何不断提升抽象层级，搭建长期运行的Claws，为其配备正确的工具、记忆和指令，从而高效地管理多个并行的Code实例。
顶级“agentic engineering”能实现的杠杆效应目前非常高。

Karpathy也并不否认，Coding Agents现在并不完美，还需要程序员为它们恰当地分解任务，在边缘部分提供帮助。但在他看来，“软件行业‘照常营业’的时期已经结束了”，软件开发的重构时刻已经到来。

△AI生成

那么，一个老问题来了：新时代已经到来，软件工程师们该何去何从？

Karpathy也和网友们讨论了这个问题。在他看来，技术深厚的程序员并不会被淘汰，相反，程序员们的技术能力还可能实现“倍增”效果。

有网友对此补充说，在人工智能时代，优秀程序员的批判性思维和审美品味会变得更加宝贵。

为了方便大家做笔记，以下附上Karpathy原推全文翻译：

很难说清楚过去两个月里，编程这件事因AI起了多大变化：这并不是“像往常一样逐步进展”式的慢慢改变，而是在去年12月发生的突变。虽然有一些值得注意的进展，但在我看来，Coding Agents在去年12月之前基本上是无法真正工作的，但12月以后情况变了——模型的质量显著提高，具有更强的长期一致性和韧性，能够完成大型且耗时的任务。这种变化的剧烈程度，已经足以颠覆传统的编程工作流。

举个例子，上周末我打算在家里搭一个分析监控视频的仪表盘，所以我写下了这样的指令：“这是我的DGX Spark的本地IP和用户名/密码。登录后，设置SSH密钥，安装vLLM，下载并测试Qwen3-VL，设置一个用于视频推理的服务器端点，创建一个基础的Web UI仪表盘，测试所有功能，用systemd配置服务，记录内存使用的相关笔记，并为我写一份Markdown格式的报告。”

Agent随后开始执行任务，花了大约30分钟。期间它遇到了多个问题，都自行在网上研究解决方案、一个接一个地解决了。它写了代码、测试、调试、设置服务，最后带着报告回来，搞定一切，而我完全没有插手。这些工作在三个月前很容易就会是一个需要整个周末才能完成的项目，但今天，只需要启动任务，然后忘记它30分钟，一切就搞定了。

编程正在被颠覆。你不再需要像过去几十年那样，在编辑器里输入计算机代码，那个时代已经结束了。现在，你要做的是启动AI Agents，用英语给它们分配任务，同时并行管理和审核它们的工作。最大的突破在于，你要如何不断提升抽象层次，搭建长期运行的协调器（Orchestrator Claws），为其配备所有正确的工具、内存和指令，从而高效地管理多个并行的代码实例。当前，通过顶级的“代理工程”（agentic engineering）所能实现的杠杆效应极高。

但它并不完美。它需要高水平的方向指引、判断力、品味、监督、迭代、提示和创意。它在某些场景下效果更好（例如任务定义明确且功能易于验证/测试的情况下）。关键在于培养直觉，学会以正确的方式拆解任务，将适合的部分交给Agent完成，并在边缘问题上提供帮助。但在我看来，现在的软件开发已经不是“照常营业”的阶段了。

另外也帮大家总结一下，去年12月后，AI Coding领域到底发生了什么：

2025年11月19日，谷歌Gemini 3系列发布。

2025年11月25日，Claude Opus 4.5发布，主打编码、Agent和computer use。并且仅仅2个月后，在今年2月初，Claude Opus 4.6也来了。

2025年12月12日，GPT-5.2系列发布，同样强调“代码能力刷新纪录”。Opus 4.6发布当天，OpenAI仅用15分钟快速回应：推出GPT-5.3-Codex。

而春节档最火“小龙虾”——OpenClaw，同样是在去年年底的这个时间段开始测试，并在今年1月一夜爆火……