2026年3月27日,来腾讯会议(限50人)了解掌握如何用Openclaw构建企业AI生产力
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Claude Code 太烧钱了?我用这 5 招,把 token 成本砍了一半!

发布日期:2026-03-26 19:23:50 浏览次数: 1523
作者:大瑜聊AI

微信搜一搜,关注“大瑜聊AI”

推荐语

Claude Code 烧钱太猛?5个实用技巧帮你轻松省下一半token成本!

核心内容:
1. 分析Claude Code烧钱的5大原因
2. 5个实用省钱技巧详解(模型选择/上下文控制等)
3. 推荐优化工具和订阅方案

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

很多人用claudeCode都一个错觉:

1、我只写了几个小功能,token就没了

2、一天随随便便用了几十美元的token,算下来甚至怀疑,难道比请个实习生还贵!

别慌,今天交给你5个省钱的小妙招,亲测下来,用好了,能省下一半的token。

原理:为什么claude这么烧钱?

先把底层逻辑给大家讲清楚,不然你只会一边心疼钱,但是一边继续烧钱。

1、每次对话都要重新读取上下文,聊得越久,花的越多。

2、系统内置prompt提示词约占18k的提示词,基本上还没开始干活,先交token

3、opus模型超级贵,比sonnet模型贵很多

4、很多人为了保证质量,写了很多rulues,.claude/rules/ 这个玩意可是每条消息都会加载。

5个省钱小妙招(收藏用起来吧)

那么知道原理了,我们就知道在哪里省下成本了?

第一条:普通任务用sonnet,特殊任务用****opus

看到sonnet4.6基本上能省下40%的token。

其实随着模型能力的加大,普通模型sonnet4.6已经能满足90%以上的任务,剩下的疑难杂症再实用opus解决。

实操方法

# 切换模型
/model sonnet

# 或启动时指定
claude --model sonnet

第二条:控制上下文在 60% 以下

上下文长度加大,会导致后面每条消耗的token增多。而且上下文的增多简洁来说是AI的负担。

譬如本来你改A的功能,结果把b的对话也放到上下文中,导致了AI的成功率降低。

因此,你需要做的是:

1、控制上下文60%以下
2、每次新的功能,新开窗口。
3、用claude.md来保存记忆,而不是用

第三条:用rules 还是用skills?

这不是一个选择,能用skills

你电脑定义100条规则,那么每次对话都会加载这100条规则

但是100个skills,可能只会用到1-2个。

要做的就是检查.claude/rules的规则,看看有什么内容,把不常用的移动到skill中。

需要的时候用 /skill xxx来加载。

第四条:依赖图工具减少文件读取

claude读取文件是线性的,很多时候会检索出来不必要的内容。

因此可以用一些工具,把文件读取改成依赖读取。

推荐下面这个几个:

  • vexp
    (VS Code 插件)— 自动建立依赖图(省下70%token)
  • ast-grep — 结构化代码搜索

  • Serena — 语言服务器包装

第五条:能用max订阅就用max订阅吧!

很少有直接用官方API,大部分都是用第三方API的。

缺点:

1、上下文比较短

2、逆向做的那种偷梁换柱严重。

因此,能用官方的还是用官方吧。注册尼日利亚icloud账号、土耳其账号充值能省下不少钱呢

写在后面的话

Claude Code 是个好工具,但不会用就是烧钱机器。

我日常的工作流:

默认sonnet,遇到难题切换opus,上下文超过60%,直接new新的对话框。

目前已经用claude做出多个小程序、海外站等内容,很多坑都是一路踩下来的。

如果你想做这些软件。可以回复大瑜微信helloaigc2023:小程序教程、或者个人网站教程。我会把0-1的经验发给你。



53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询