微信扫码
添加专属顾问
我要投稿
Claude Code 烧钱太猛?5个实用技巧帮你轻松省下一半token成本!核心内容: 1. 分析Claude Code烧钱的5大原因 2. 5个实用省钱技巧详解(模型选择/上下文控制等) 3. 推荐优化工具和订阅方案
很多人用claudeCode都一个错觉:
1、我只写了几个小功能,token就没了
2、一天随随便便用了几十美元的token,算下来甚至怀疑,难道比请个实习生还贵!
别慌,今天交给你5个省钱的小妙招,亲测下来,用好了,能省下一半的token。
先把底层逻辑给大家讲清楚,不然你只会一边心疼钱,但是一边继续烧钱。
1、每次对话都要重新读取上下文,聊得越久,花的越多。
2、系统内置prompt提示词约占18k的提示词,基本上还没开始干活,先交token
3、opus模型超级贵,比sonnet模型贵很多
4、很多人为了保证质量,写了很多rulues,.claude/rules/ 这个玩意可是每条消息都会加载。
那么知道原理了,我们就知道在哪里省下成本了?
第一条:普通任务用sonnet,特殊任务用****opus。
看到sonnet4.6基本上能省下40%的token。
其实随着模型能力的加大,普通模型sonnet4.6已经能满足90%以上的任务,剩下的疑难杂症再实用opus解决。
实操方法
# 切换模型
/model sonnet
# 或启动时指定
claude --model sonnet
第二条:控制上下文在 60% 以下
上下文长度加大,会导致后面每条消耗的token增多。而且上下文的增多简洁来说是AI的负担。
譬如本来你改A的功能,结果把b的对话也放到上下文中,导致了AI的成功率降低。
因此,你需要做的是:
1、控制上下文60%以下
2、每次新的功能,新开窗口。
3、用claude.md来保存记忆,而不是用
第三条:用rules 还是用skills?
这不是一个选择,能用skills
你电脑定义100条规则,那么每次对话都会加载这100条规则
但是100个skills,可能只会用到1-2个。
要做的就是检查.claude/rules的规则,看看有什么内容,把不常用的移动到skill中。
需要的时候用 /skill xxx来加载。
第四条:依赖图工具减少文件读取
claude读取文件是线性的,很多时候会检索出来不必要的内容。
因此可以用一些工具,把文件读取改成依赖读取。
推荐下面这个几个:
ast-grep — 结构化代码搜索
Serena — 语言服务器包装
第五条:能用max订阅就用max订阅吧!
很少有直接用官方API,大部分都是用第三方API的。
缺点:
1、上下文比较短
2、逆向做的那种偷梁换柱严重。
因此,能用官方的还是用官方吧。注册尼日利亚icloud账号、土耳其账号充值能省下不少钱呢
Claude Code 是个好工具,但不会用就是烧钱机器。
我日常的工作流:
默认sonnet,遇到难题切换opus,上下文超过60%,直接new新的对话框。
目前已经用claude做出多个小程序、海外站等内容,很多坑都是一路踩下来的。
如果你想做这些软件。可以回复大瑜微信helloaigc2023:小程序教程、或者个人网站教程。我会把0-1的经验发给你。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-26
GitHub 悄悄改了规则,你的代码可能正在被拿去训练 AI
2026-03-26
Harness is the New Dataset:模型智能提升的下一个关键方向
2026-03-26
Google 亲手证明:GUI 已死,但尸体还在动
2026-03-26
治愈 Cursor AI 编程的 “幻觉”?用它就够了!
2026-03-26
Anthropic官方复盘Claude Code:智能体系统设计的四个核心
2026-03-26
Claude Code auto mode 解析:如何用 AI 分类器替代人工审批
2026-03-26
Google 最新极限压缩算法,砸碎大模型本地部署的内存墙,8 倍提升!
2026-03-26
Google 发了个压缩算法,内存砍 6 倍,速度快 8 倍,精度零损失
2026-01-24
2026-01-10
2026-01-01
2026-01-26
2026-01-09
2026-01-09
2026-01-23
2025-12-30
2026-01-14
2026-01-21
2026-03-22
2026-03-22
2026-03-21
2026-03-20
2026-03-19
2026-03-19
2026-03-19
2026-03-18