2026年4月23日 周四晚上19:30,来了解“从个人单点提效,到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

Opus 4.7 落地了,聊聊我摸出来的使用技巧

发布日期:2026-04-18 06:40:13 浏览次数: 1515
作者:与AI同行之路

微信搜一搜,关注“与AI同行之路”

推荐语

Claude Opus 4.7 正式发布,掌握这些技巧让你的编码效率翻倍!

核心内容:
1. Opus 4.7 与 Sonnet 4.6 的适用场景对比与选择建议
2. Effort Level 的实战选择策略与注意事项
3. Task Budget 新功能的正确使用方法与技巧

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

昨天(4月16号)Anthropic 正式发布了 Claude Opus 4.7,Claude Code 用户直接就能用上了。我从昨晚一直折腾到现在,结合全网 Hacker News、推特上的讨论,以及 Claude Code 创始人 Boris Cherny 本人分享的使用经验,把一些实用的技巧整理出来,都是干货,拿来就能用的那种。

先搞清楚一件事:什么时候该用 Opus 4.7

这是我觉得最重要的一条,但很多人搞反了。

Opus 4.7 不是用来替代 Sonnet 的,它是用来干"重活"的。Sonnet 4.6 能搞定你日常 80% 的编码工作,写个 CRUD、改个样式、加个接口,用 Sonnet 又快又便宜。但如果你要做深度 debug、大规模重构、长时间的上下文密集型会话,或者那种以前每隔十五分钟就得去看一眼有没有跑偏的任务——这才是 Opus 4.7 的主场。

推特上有个哥们说得挺形象:Opus 是那种你可以甩一个复杂 PR 给它,出去喝杯咖啡回来发现它已经搞定的模型。Sonnet 是你坐在旁边一起干活的搭档。定位不一样,别混着用。


Effort Level 怎么选——这是个学问

4.7 新增了一个 xhigh 的 effort 级别,卡在原来的 high 和 max 之间。Anthropic 官方推荐把 xhigh 作为 Agentic coding 的默认值,Claude Code 里也确实把它设成了默认。

但我自己的体感是这样的:

xhigh 是大多数场景的甜点 —— 编码、Agent 任务、复杂推理,直接用 xhigh 就行,不用想太多。

high 适合赶时间 —— 如果你在做一些不需要深度推理的活儿,或者 token 预算有限,降到 high 可以省不少。速度也明显快一截。

max 要慎用 —— 只在那种真正需要深度推理的硬骨头上才开 max。这个级别有个坑:它容易 overthinking,就是想太多,反而把简单问题搞复杂了。Hacker News 上有人吐槽过这个,我自己也遇到了。

用 /model 命令切换,effort 的配置在 Claude Code 里也可以调。


Task Budget——给 AI 一个"弹药限额"

这是 4.7 新出的功能,目前还在 public beta 阶段。简单说就是你可以给 Claude 设定一个 token 预算上限,它会看着这个倒计时来分配精力,快到预算的时候会自动收尾,优雅地结束任务。

几个注意事项:

这不是硬上限,是一个"建议"。Claude 会参考这个数字来规划自己的工作,但不会像 max_tokens 那样到了就直接截断。max_tokens 是每次请求的硬性天花板,模型自己看不到这个值;task_budget 是整个 agentic 循环的软性预算,模型能感知到。

如果预算设得太紧,模型可能会草草了事甚至直接拒绝。所以别把预算掐得太死,最小值是 20k tokens。

对于那种开放性的、质量优先的 Agent 任务,我的建议是别设 task budget。这个功能更适合你明确知道"这个活儿不值得烧太多 token"的场景。

API 调用的代码大概长这样:

response = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=128000,
    output_config={
        "effort"
: "high",
        "task_budget"
: {"type": "tokens", "total": 128000},
    },
    messages=[...],
    betas=["task-budgets-2026-03-13"],
)

它变"实诚"了——Prompt 要跟着改

这一条是个大坑,不少人已经踩了。

Opus 4.7 对指令的理解变得更加字面化了。以前 4.6 会"脑补"你的意图,你说得模糊一点它也能猜到你想干嘛。现在 4.7 不猜了,你说什么它就做什么。

这意味着什么?你以前写的那些 prompt,那些 CLAUDE.md 里的指令、各种 skills 配置,可能需要重新审视一遍。像"尽量"、"如果可能的话"这类软性措辞,4.7 会比以前更认真地对待。你说"尽量简洁",它真的会很简洁,可能简洁到你觉得信息不够。

Anthropic 官方文档里也特别提到了这一点:如果你之前在 prompt 里加了一些"兜底"的scaffolding,比如"double-check the slide layout before returning",现在可以试试把这些去掉,因为模型自己的自检能力已经够强了。反过来,那些你随手写的、不太精确的指令,可能会产生意想不到的结果。

推特上有人总结得好:4.6 是那种"你说个大概方向我来发挥"的员工,4.7 是"你说什么我就做什么,说清楚"的员工。各有各的好处,但用法得调整。


视觉能力大升级——做 Computer Use 的有福了

这次视觉能力的提升是实打实的。最大图片分辨率从 1568px / 1.15MP 直接拉到了 2576px / 3.75MP,三倍多的提升。

更关键的一个改动是:模型输出的坐标现在和实际像素是 1:1 映射的,不再需要做缩放换算了。做过 Computer Use 的都知道以前那个坐标转换有多烦,现在直接省了这一步。

低级感知能力也增强了——指向、测量、计数这些基础操作更准了,图片中的目标定位和检测也有改善。

不过有个细节要注意:高分辨率图片会消耗更多 token。如果你的场景不需要那么高的图片精度,传图之前先降采样,能省不少钱。


/ultrareview——让 AI 帮你 Code Review

这是 4.7 带来的新命令,挺有意思的。它会在云端启动一组 reviewer agent,专门帮你检查代码里的真实 bug,不是那种"这里建议加个注释"的风格建议,是真正的逻辑错误、边界问题这类。

Pro 和 Max 用户有三次免费额度可以体验。如果你平时是一个人干活没人帮你 review,这个功能值得试试。


API 迁移的几个破坏性变更

如果你在自己的应用里通过 API 调用 Claude,这几个变更一定要注意:

Extended Thinking 的 budget_tokens 没了 —— 现在只支持 adaptive thinking。以前那种 thinking: {"type": "enabled", "budget_tokens": 32000} 的写法会直接报 400 错误。改成 thinking: {"type": "adaptive"} 就行。而且 adaptive thinking 默认是关的,需要显式开启。

temperature、top_p、top_k 全部不能设了 —— 设非默认值直接 400。最安全的做法是把这些参数从请求里直接删掉。如果你以前用 temperature=0 来求确定性输出,说实话那本来也不保证完全一致。

思考内容默认不返回了 —— thinking blocks 还在流式输出里出现,但 thinking 字段默认是空的。如果你的产品需要展示推理过程,加一行 "display": "summarized" 就能恢复。不加的话用户会看到一段长时间的"空白等待",体验不好。

新的 tokenizer —— 同样的文本,4.7 可能比 4.6 多消耗 0% 到 35% 的 token。建议把 max_tokens 的值适当放宽,给够余量。


文件级记忆能力增强了

先澄清一点:Opus 4.7 本身并没有原生的跨会话记忆,模型依然是无状态的。所谓的"记忆增强",是指它在读写文件系统级别的记忆这件事上做得更好了。

比如 Claude Code 里的 MEMORY.md~/.claude/projects/ 下面的记忆文件,或者你自己搭的 Agent 里维护的 scratchpad、notes 文件——4.7 更擅长往里面"记笔记",也更擅长在后续任务里把之前记的东西翻出来用。跨会话的连续性,本质上还是靠文件持久化实现的,只是模型更会用"笔记本"了。

Anthropic 还提供了一个 memory tool,可以给 Claude 一个托管的 scratchpad,不用你自己搭文件存储。如果你在做 Agent 开发,这个值得看一下。


Boris Cherny 的使用心得——来自 Claude Code 创始人

Boris Cherny 是 Claude Code 的创始人和产品负责人,他在 Opus 4.7 发布当天就发了一系列帖子分享自己 dogfooding 几周的经验。这些建议的含金量很高,毕竟是最了解这个工具的人。

把 Claude 当你要委派任务的工程师,不是坐你旁边结对编程的搭档。 这是 Boris 反复强调的核心理念。具体来说就是:第一条 prompt 就把意图、约束、验收标准、相关文件路径全部交代清楚,别像聊天一样一点一点喂。你越是前置信息,它一次做对的概率就越高。

可以大胆放手,比如直接说"去修掉 CI 里的失败测试"。 不用手把手告诉它先看哪个文件、用什么方法。4.7 在 agentic 方面的能力已经足够自己规划执行路径了。

Boris 的日常 prompt 模式: 他现在很多 prompt 就是 "Claude do blah blah /go"。/go 是一个自定义 skill,会让 Claude 自动完成三件事——用 bash、浏览器或 Computer Use 做端到端测试,跑一遍 /simplify 做代码精简,然后直接提 PR。对于长时间运行的任务,验证环节尤其重要,这样你回来看的时候就知道代码是能跑的。

Worktree 并行——Boris 说这是最大的生产力提升。 他自己日常会同时开 3-5 个 git worktree,每个 worktree 跑一个独立的 Claude Code 会话。用 claude --worktree 或者桌面端的 checkbox 就能开。这样多个任务互不干扰,互不阻塞。用他的原话说,这是 "the single biggest productivity unlock"。

Plan Mode 先行。 复杂任务先按两下 shift+tab 进入 plan mode,把方案迭代清楚了再动手写代码。Boris 的原话是 "pour your energy into the plan so Claude can 1-shot the implementation"——把精力花在计划上,让 Claude 一次性把实现写对。如果中途发现方向不对,别硬纠正,直接切回 plan mode 重新规划。用 /rewind 回退,而不是在错误的基础上打补丁,因为失败的尝试会污染你的上下文窗口。

Effort 的选择: Boris 自己大部分任务用 xhigh,只有真正的硬骨头才开 max。他还提到一个细节:max effort 只在当前 session 生效,切到新 session 会恢复之前的设置,但其他 effort 级别会跨 session 持久化。

CLAUDE.md 当"组织记忆"用。 每次 Claude 犯了一个错你纠正了它,就把这条经验写进 CLAUDE.md。这样下次新开 session 它就不会再犯同样的错。Boris 的团队甚至会在每个 PR 合并后自动更新项目级的 notes 目录。

把常用工作流做成 slash command。 如果一个操作你每天要用不止一次,就做成 .claude/commands/ 下面的命令。Boris 团队有 /techdebt 用来消除重复代码,还有从 Slack、Google Drive、Asana、GitHub 同步上下文的命令。


从社区讨论里捞到的几条经验

Hacker News 上有人问 SWE-bench Pro 提升了 11%,到底是解决了更难的问题还是减少了幻觉?这个问题其实挺好的。从我实际使用的感受来看,两方面都有。它在规划阶段就能发现自己的逻辑漏洞了,不用等到执行完才发现搞错了方向。

推特上有个开发者分享了一个很实用的工作流:把 Opus 4.7 的 permission mode 设成 acceptEdits 或者 auto,配合 xhigh effort,基本就是"甩任务然后去干别的"。当然,这要求你的项目有足够的测试覆盖,不然出了问题你也不知道。

还有人提到,4.7 默认会少 spawn subagent,tool call 也比 4.6 少,更倾向于靠自己的推理能力解决问题。如果你发现它不够主动地使用工具,可以在 prompt 里明确引导。Anthropic 的官方博客也确认了这一点,建议在 prompt 里明确描述什么时候、为什么需要使用工具。

另外一个行为变化值得注意:4.7 的回复长度会根据任务复杂度自动调节。简单问题给短答案,开放性分析给长答案。如果你对输出长度有明确要求,最好在 prompt 里直接说明。


我的使用建议

说了这么多,总结几条我自己验证过的实操建议:

先别急着把所有任务都切到 Opus 4.7。日常编码用 Sonnet 4.6,把 Opus 4.7 留给那些真正需要深度思考的场景,这样既省钱又高效。

升级后第一件事是检查你的 CLAUDE.md 和各种 prompt 配置。4.7 的字面化理解是把双刃剑,指令越精确效果越好,但模糊的指令也会被严格执行。

如果你在做 API 集成,迁移前先过一遍 breaking changes 清单。temperature 参数被删、extended thinking 语法变了、tokenizer 换了,这几个不处理直接就是 400 错误。

善用 task budget 来控制成本,但别在需要高质量输出的开放性任务上设它。

最后,4.7 的视觉能力提升是真的大。如果你之前觉得 Claude 的 Computer Use 不太靠谱,现在值得再试一次。


     

    53AI,企业落地大模型首选服务商

    产品:场景落地咨询+大模型应用平台+行业解决方案

    承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

    联系我们

    售前咨询
    186 6662 7370
    预约演示
    185 8882 0121

    微信扫码

    添加专属顾问

    回到顶部

    加载中...

    扫码咨询