微信扫码
添加专属顾问
我要投稿
Claude Code 烧钱太猛?5个实用技巧帮你轻松省下一半token成本! 核心内容: 1. 分析Claude Code烧钱的5大原因 2. 5个实用省钱技巧详解(模型选择/上下文控制等) 3. 推荐优化工具和订阅方案
很多人用claudeCode都一个错觉:
1、我只写了几个小功能,token就没了
2、一天随随便便用了几十美元的token,算下来甚至怀疑,难道比请个实习生还贵!
别慌,今天交给你5个省钱的小妙招,亲测下来,用好了,能省下一半的token。
先把底层逻辑给大家讲清楚,不然你只会一边心疼钱,但是一边继续烧钱。
1、每次对话都要重新读取上下文,聊得越久,花的越多。
2、系统内置prompt提示词约占18k的提示词,基本上还没开始干活,先交token
3、opus模型超级贵,比sonnet模型贵很多
4、很多人为了保证质量,写了很多rulues,.claude/rules/ 这个玩意可是每条消息都会加载。
那么知道原理了,我们就知道在哪里省下成本了?
第一条:普通任务用sonnet,特殊任务用****opus。
看到sonnet4.6基本上能省下40%的token。
其实随着模型能力的加大,普通模型sonnet4.6已经能满足90%以上的任务,剩下的疑难杂症再实用opus解决。
实操方法
# 切换模型
/model sonnet
# 或启动时指定
claude --model sonnet
第二条:控制上下文在 60% 以下
上下文长度加大,会导致后面每条消耗的token增多。而且上下文的增多简洁来说是AI的负担。
譬如本来你改A的功能,结果把b的对话也放到上下文中,导致了AI的成功率降低。
因此,你需要做的是:
1、控制上下文60%以下
2、每次新的功能,新开窗口。
3、用claude.md来保存记忆,而不是用
第三条:用rules 还是用skills?
这不是一个选择,能用skills
你电脑定义100条规则,那么每次对话都会加载这100条规则
但是100个skills,可能只会用到1-2个。
要做的就是检查.claude/rules的规则,看看有什么内容,把不常用的移动到skill中。
需要的时候用 /skill xxx来加载。
第四条:依赖图工具减少文件读取
claude读取文件是线性的,很多时候会检索出来不必要的内容。
因此可以用一些工具,把文件读取改成依赖读取。
推荐下面这个几个:
ast-grep — 结构化代码搜索
Serena — 语言服务器包装
第五条:能用max订阅就用max订阅吧!
很少有直接用官方API,大部分都是用第三方API的。
缺点:
1、上下文比较短
2、逆向做的那种偷梁换柱严重。
因此,能用官方的还是用官方吧。注册尼日利亚icloud账号、土耳其账号充值能省下不少钱呢
Claude Code 是个好工具,但不会用就是烧钱机器。
我日常的工作流:
默认sonnet,遇到难题切换opus,上下文超过60%,直接new新的对话框。
目前已经用claude做出多个小程序、海外站等内容,很多坑都是一路踩下来的。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-18
从0开发大模型的17种Agent架构演进详细拆解
2026-05-18
Anthropic 的 Dreaming 功能,解决的是"谁托管你的 Agent 循环"的问题
2026-05-18
腾讯上线 AI 设计平台 Ardot,一句话生成 UI 设计稿,AI 版 Figma
2026-05-16
Kiro:亚马逊新出的 AI 编程工具,免费白嫖一个月 Claude Opus 4.7
2026-05-16
突发!OpenAI高层巨震,ChatGPT与CodeX或合并,超级AI来了!
2026-05-16
AI Native 创业手册 | 蚂上WEEKLY VOL.172
2026-05-16
腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了
2026-05-16
从零构建AI Agent:没有魔法,只有循环
2026-04-15
2026-03-31
2026-03-13
2026-04-07
2026-03-17
2026-03-17
2026-04-07
2026-03-21
2026-02-20
2026-04-24
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07
2026-04-26
2026-04-22
2026-04-18