微信扫码
添加专属顾问
我要投稿
Shopify 通过 Claude Code 实现 96% 代码自动化,其“策略优先”的 AI 原生工程实践为团队效率提升提供了可复刻的蓝图。核心内容:1. Shopify 集中式 LLM 代理架构实现成本与模型控制2. 并行智能体模式将工程师角色转向审查与合并3. 从工具标准化到基础设施标准化的工程思维转变
大家好,我是Tony Bai。
这篇来自 X (Twitter) 的深度好文剖析了 Shopify 如何通过 Claude Code 实现工程效率的飞跃。文章不仅分享了其 23,000 名工程师背后的核心配置逻辑,还详细介绍了从Agents)" data-itemshowtype="0" linktype="text" data-linktype="2">并行智能体(Agents)到 MCP" data-itemshowtype="0" linktype="text" data-linktype="2">MCP 工具包,再到“策略优先”的工作流转型。如果你正在思考如何将 AI 真正集成到团队的开发流水线中,这份来自“未来视角”的 AI 原生工程实践手册(AI-first playbook)绝对值得深入研读与复刻。下面是文章译文全文:
Shopify 的 23,000 名工程师正致力于在今年第三季度实现 96% 的代码自动化。
他们同时运行多个 Claude Code 智能体,每个智能体处理代码库的不同部分,而工程师只需进行审查和合并。
Bessemer 发布了他们完整的 AI 优先手册。
以下是他们的确切配置,你可以在 5 分钟内完成复刻 👇
Shopify 没有标准化某一个 AI 工具。他们标准化了底层的架构。
他们构建了一个内部 LLM 代理(Proxy),将每一个 AI 请求路由到同一个网关。无论使用 Claude Code、GitHub Copilot 还是 Cursor,它们都流经相同的基础设施。
Shopify 的 LLM 代理架构:
工程师 -> Claude Code / Copilot / Cursor
↓
LLM 代理 (集中式网关)
↓
OpenAI / Anthropic / Google 模型
↓
使用分析 + 成本控制 + 模型路由
这赋予了他们集中式的成本控制、使用分析,以及在不改变任何工程师工作流的情况下更换模型的能力。
给小团队的启示: 不要只选一个工具就全力投入。先构建基础设施,这样你就可以在保持对成本和数据控制的同时,试验不同的工具。
Shopify 的资深工程师不会把 Claude Code 当作一个简单的“提问-回答”工具。
他们会同时启动多个智能体,在代码库的不同部分工作。
一个智能体负责重构认证模块。另一个负责编写测试。第三个更新文档。工程师负责审查输出,丢弃无效内容,合并有效内容。
bash 示例:
# 终端 1:负责重构认证的智能体
claude -p "refactor src/auth/ to use the new session handler"
# 终端 2:负责编写测试的智能体
claude -p "write integration tests for the payment flow"
# 终端 3:负责更新文档的智能体
claude -p "update API documentation for all changed endpoints"
工程师的工作职责从“写代码”转变为“审查和合并”智能体的输出。Shopify 工程副总裁 Farhan Thawar 将此称为“编排智能系统”。
并非每个任务都能受益于并行化。对于复杂的架构决策,Shopify 工程师会让单个智能体运行扩展的批判循环。
智能体生成一个答案,评估它,修改它,并在漫长的推理周期中继续精炼。
他们不接受第一次输出,而是强迫智能体自我辩论。
提示词模式:
"针对 [X] 提出一个架构方案。 然后批判你自己的提议:在规模化(scaling)时会出现什么问题? 根据你的批判进行修改。 再次批判该修订版。 给出最终版本,并附带每个决策的置信度水平。"
这种方式产生的结果比单一提示词好得多,因为 Claude 在你发现错误之前就已经抓住了自己的错误。
在 2026 年 4 月,Shopify 发布了一个开源的 MCP (Model Context Protocol) 服务器,将 Claude Code 直接连接到 Shopify 的文档、GraphQL API 模式和在线商店操作。
只需一条命令即可安装:
claude mcp add --transport stdio shopify-dev-mcp -- npx -y @shopify/dev
这赋予了 Claude Code 7 种工具:
如果没有这些,Claude 会产生幻觉、臆造 API 字段或组件模式。有了它,Claude 能够处理真实的平台数据。
Shopify 不把 CLAUDE.md 视为个人配置,它是提交到 Git 并供 23,000 名工程师共享的团队基础设施。
他们的方案示例:
# CLAUDE.md (Shopify internal pattern)
## Stack
Ruby on Rails, React, GraphQL, MySQL
## Commands
- Dev: `dev up && dev server`
- Test: `dev test [path]`
- Lint: `dev style`
- Type check: `bin/srb tc`
## Architecture
- app/models/ → ActiveRecord models, business logic
- app/controllers/ → thin controllers, delegate to services
- app/services/ → service objects for complex operations
- app/graphql/ → GraphQL types, mutations, resolvers
## Rules
- NEVER bypass Sorbet type checking
- All new code must have type signatures
- Database queries only through established patterns
- IMPORTANT: run `dev test` after every change
来自会议的核心见解:在 CLAUDE.md 中塞入每一个标准和规范会让性能变差,而非变好。你在每一个环节都要为此付出代价。
这是 Shopify 的方法与其他团队最不同的地方。
在 2024 年,工程师将 70% 的时间花在执行(写代码)上,30% 花在策略上。
在 2026 年,Shopify 翻转了这个比例。
因为 AI 处理了大部分编码工作,工程师现在将 70% 的时间花在策略上:映射用户流、验证市场需求、选择正确的架构。只有 30% 的时间花在执行上。
工作流对比:
AI 编写代码。人类负责决定代码存在的意义。
Shopify 不会让智能体野蛮生长。他们的Claude Code 护栏设置如下:
json 示例:
{
"permissions": {
"allow": [
"Read", "Glob", "Grep", "LS", "Edit",
"Bash(dev test *)",
"Bash(dev style *)",
"Bash(git status)",
"Bash(git diff *)",
"Bash(git add *)",
"Bash(git commit *)"
],
"deny": [
"Read(**/.env*)",
"Bash(git push *)",
"Bash(dev deploy *)",
"Bash(bin/rails db:drop *)",
"Bash(rm -rf *)"
],
"defaultMode": "acceptEdits"
}
}
智能体可以读取、编写、测试、重构和提交。它们不能推送到远程仓库、部署到生产环境、删除数据库或读取密钥。
人类在任何不可逆的操作中保持参与。
你不需要 23,000 名工程师来使用这些模式。以下是初学者版本:
Shopify 20% 的生产力提升并非来自编写更多的代码,而是来自探索 10 种方案而非 2 种、更快的原型设计以及捕捉错误。
最能发挥 Claude Code 价值的团队不是那些拥有最强提示词的团队,而是那些构建了基础设施,让智能体能够安全、并行、在真实代码库上工作的团队。
2026 年第三季度实现 90% 的自主编码。 这不是愿景宣言,而是 23,000 名工程师正在努力达成的最后期限。
今日互动探讨:
Shopify 提出的 “70% 策略 + 30% 执行” 模型,预示着程序员的定义正在发生根本性位移:从“写代码的人”变成“编排智能的人”。
面对这种“AI 自动驾驶”式的开发工作流,我想听听你的看法:
欢迎在评论区分享你的实战心得,我们一起预演 AI 原生时代的工程化未来。👇
如果本文对你有所帮助,请帮忙点赞、推荐和转发
!
点击下面标题,阅读更多干货!
- 还在当“上下文搬运工”?我写了一门课,帮你重塑AI开发工作流
- 告别单打独斗!Claude Code 全新“Agent Team”模式:当 AI 开始组队干活
- Google 开源 AX 与 Agent Substrate:构建以 Agent 为核心的云原生计算底座
- 大洗牌!Google 内部确认:Go 正取代 C++,成为 AI Agent 时代的“通用语言”
- 从“Vibe-Coding”到“Agentic Engineering”:Andrej Karpathy 的 AI 时代程序员生存法则
🔥 还在为“复制粘贴喂AI”而烦恼?我的新极客时间专栏 《AI原生开发工作流实战》 将带你:
扫描下方二维码👇,开启你的AI原生开发之旅。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-23
Harness Monitor:当多个 Agent 同时写代码时,如何看住质量
2026-05-23
从 Appshots 到 Goal Mode:Codex 正在变成工作流 Agent
2026-05-23
2小时烧掉9亿token后,我发现了OpenAI和Anthropic在/goal上的本质区别
2026-05-23
我在一天内完成10场用户访谈,领导大受震撼
2026-05-23
Codex 的 computer use 功能,为什么这么好用?
2026-05-22
我让3个AI吵了一整天架,它们把PRD写完了
2026-05-22
Cursor 把内部代码审查工具放出来了,AI 写代码之后,质量风险变了
2026-05-22
Codex 又又又更新了,这次能拍图带上下文,/goal 也正式上线了
2026-04-15
2026-04-07
2026-03-31
2026-03-13
2026-03-17
2026-04-07
2026-03-17
2026-03-21
2026-04-24
2026-03-06
2026-05-23
2026-05-21
2026-05-19
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07