Claude Sonnet 5 来了：Opus 级智能，Sonnet 级价格

发布日期：2026-07-01 07:08:37 浏览次数： 1559

作者：码间 AI

微信搜一搜，关注“码间 AI”

PART 01

PART 01 最强 Sonnet 诞生：向 Opus 发起冲击

Claude Sonnet 5 被定位为 Anthropic 迄今为止最具 agentic 能力的 Sonnet 模型。它能够制定计划、调用浏览器和终端等工具，并以自主方式执行复杂任务——而在短短几个月前，这类能力还需要更大、更昂贵的模型才能实现。

对许多开发者而言，agentic AI 时代正是从 Sonnet 级模型开启的：Claude Sonnet 3.5、3.6 和 3.7 是第一批在编码和工具使用方面展现出惊人能力的模型。但在此之后，agentic 能力最显著的提升集中在了 Opus 级模型上。

Sonnet 5 缩小了这一差距。它的性能接近 Opus 4.8，但价格更低。与前代 Sonnet 4.6 相比，Sonnet 5 在推理、工具使用、编码和知识工作等 agentic 性能的关键维度上都有大幅提升。

Sonnet 5 vs Sonnet 4.6 vs Opus 4.8 基准测试得分对比

我们的安全评估发现，Sonnet 5 的不良行为率总体低于 Sonnet 4.6，在 agentic 场景中使用更加安全。同时，评估也显示它在网络安全任务上的能力远低于当前的 Opus 模型。

从今天起，Claude Sonnet 5 已在所有计划中开放使用。Free 和 Pro 计划的用户将直接使用 Sonnet 5 作为默认模型，Max、Team 和 Enterprise 用户也可以使用它。Claude Code 和 Claude 平台同样支持该模型。Claude 平台上线时提供限时优惠价格：每百万 input tokens 2 美元（约 14.4 元人民币）、每百万 output tokens 10 美元（约 72 元人民币），有效期至 2026 年 8 月 31 日。之后将恢复标准价格：每百万 input tokens 3 美元（约 21.6 元人民币）、每百万 output tokens 15 美元（约 108 元人民币）。开发者可通过 Claude API 使用 claude-sonnet-5 模型。

PART 02

PART 02 性能与成本的最优解：BrowseComp 与 OSWorld 实测

下面两张图表展示了 Sonnet 5 在不同 effort 级别下的表现，分别对应 agentic 搜索评估 BrowseComp 和计算机使用评估 OSWorld-Verified。

Sonnet 5（橙色线）相比 Sonnet 4.6（灰色线）实现了全面超越，并且比 Opus 4.8（黄色线）提供了更宽泛的成本-性能选择区间。在中等 effort 级别下，Sonnet 5 的成本效率显著提升；在高 effort 级别下，它的部分任务表现甚至可以匹敌 Opus 4.8。用户可以在 Sonnet 5 和 Opus 4.8 之间通过调整 effort 级别，找到成本与性能的最佳平衡点。

图表中的价格基于 Sonnet 5 的标准定价（每百万 input tokens 3 美元、每百万 output tokens 15 美元）。在 8 月 31 日前的限时优惠期间（每百万 input tokens 2 美元、每百万 output tokens 10 美元），Sonnet 5 的实际成本比图表所示更低。Opus 4.8 的定价为每百万 input tokens 5 美元、每百万 output tokens 25 美元。

合作伙伴的早期反馈高度一致：Sonnet 5 的 agentic 能力远超前代。测试者描述了它如何完成前代 Sonnet 模型会中途放弃的复杂任务、如何在未被要求的情况下主动检查自身输出，以及如何以极具吸引力的价格完成所有这些 agentic 工作。

Cursor — Zimu Li（技术团队成员）："Claude Sonnet 5 为我们的 agent 提供了强大的多步骤软件工程执行层。它在复杂的混乱技术环境中出色地完成持续编码、工具使用和调试，对需要执行力和技术根基的工作流尤其有用。"

Glean — Daniel Shepard（高级工程师）："我们给 Claude Sonnet 5 交了一个两步任务——更新 Salesforce 账户层级、向企业联系人发送上线公告——它端到端完成了。以前这类任务通常会卡在中途。对于日常自动化来说，这是个不需要思考的选择。"

Lovable — Fabian Hedin（联合创始人）："Claude Sonnet 5 用更少的步骤完成了同样的事。输出质量不变，但过程更简洁。它也能干净利落地拒绝不安全的请求。在 Lovable，我们将强大的工具交到数百万构建者手中。一个知道何时说'不'的模型和一个知道如何构建的模型同样重要。"

Sourcegraph — Yusuke Kaji（AI for Business 总经理）："我们将 Claude Sonnet 5 投入数十个最具挑战性的真实 Pull Request 中，它每次都独立完成了从处理到测试验证的全流程——让工程师们专注于判断、决策和最终审批。"

CodeRabbit — Neel Chotai（Rust 工程师兼软件工程师）："我让 Claude Sonnet 5 调查一个 bug。它在没有被提示的情况下，自发编写了复现测试、实现了修复，然后暂存代码以确认没有修复时 bug 会复现。整个流程一次完成。"

Warp — Sualeh Asif（联合创始人）："有了 Claude Sonnet 5，agent 能遵循计划、遵守规范、交付干净的多步骤变更，而且成本高效。"

Electric — Dominic Elm（创始工程师）："Claude Sonnet 5 在存量代码上表现最佳——竞态条件、隐藏测试、那些没人想碰的部分。它能追溯故障的真实根因，交付持久修复，而不是修补症状。"

Eve — Mauricio Wulfovich（Staff ML 工程师）："Claude Sonnet 5 位于 Eve 律所诉讼任务的帕累托前沿。我们在法律研究和分析方面看到了最明显的提升，性价比优势让迁移决策变得轻松。"

ClickHouse — Ryadh Dahimene（AI/ML 产品总监）："ClickHouse agent 实时探索数据并即时生成洞察，测试新模型时，获取洞察的速度至关重要。Claude Sonnet 5 的推理步骤更紧凑，让用户更快得到答案。这种速度差异是客户能感受到的。"

Pace — Eric He（技术团队成员）："在 Pace，我们的 computer-use agent 在运营团队已有的系统上运行保险工作流——提交受理、首次损失通知、损失记录。Claude Sonnet 5 始终采取正确的操作并且速度很快，这正是真实保险工作所要求的。"

PART 03

PART 03 安全评估：更安全，但保持警觉

我们的部署前安全评估发现，Sonnet 5 在安全性上总体优于 Sonnet 4.6。在 agentic 安全方面，该模型更擅长拒绝恶意请求和抵御 prompt injection 攻击中的劫持尝试。Sonnet 5 的幻觉率和谄媚率也低于 Sonnet 4.6。

在我们的自动化行为审计中——该审计测试了包括滥用协作和欺骗在内的多种不对齐行为——Sonnet 5 的总体得分更低（即更安全）。不过，与更强大的 Opus 4.8 和 Claude Mythos Preview 相比，Sonnet 5 在这项评估中显示出稍高的不对齐行为率。

我们并未刻意训练 Sonnet 5 执行网络安全任务。它可以完成一些常规的、无害的网络任务，但在测试潜在危险网络技能的评估中——例如开发软件漏洞利用——它的表现远低于 Opus 4.8 和 Mythos 5 等模型。

在一项测试模型开发 Firefox 浏览器漏洞利用能力的评估中（该评估由我们与 Mozilla 合作开发，所有漏洞已在 Firefox 148 中修补），Sonnet 5 始终未能开发出完整的可用漏洞利用，但其部分成功率比 Sonnet 4.6 略高。后者的提升可能源于通用智能的提升，而非特定训练。

由于 Sonnet 5 在这些任务上比前代略有增强，我们默认启用了网络安全保护措施来发布该模型。这些保护措施能够实时检测并拦截危险的网络使用行为，与 Claude Opus 4.7 和 4.8 中的措施相同（因为我们判断 Sonnet 5 的整体网络安全风险较低，所以保护措施不如 Fable 5 那样严格，后者拦截的网络安全任务范围更广）。

我们对 Sonnet 5 在多项安全和能力评估中的完整评估结果已发布在 Claude Sonnet 5 System Card 中。

PART 04

PART 04 即刻可用：定价与速率限制

Claude Sonnet 5 今天起在所有平台上可用。限时优惠价格为每百万 input tokens 2 美元（约 14.4 元人民币）、每百万 output tokens 10 美元（约 72 元人民币），有效期至 2026 年 8 月 31 日。之后恢复标准价格：每百万 input tokens 3 美元（约 21.6 元人民币）、每百万 output tokens 15 美元（约 108 元人民币）。

我们已提高 Chat、Cowork、Claude Code 和 Claude 平台的速率限制，以适应更高 effort 级别带来的更高 token 使用量。用户可以根据具体项目需求选择合适的 effort 级别。

关于定价的一个细节：Sonnet 5 是 Sonnet 4.6 的升级版，但使用了更新的 tokenizer，改变了模型处理文本的方式以提升性能（这与我们在 Claude Opus 4.7 中引入的 tokenizer 变更类似）。权衡在于，相同的输入可能映射为更多的 tokens：根据内容类型不同，大约为 1.0 到 1.35 倍。限时优惠价格的设定确保了向 Sonnet 5 过渡的成本大致持平。

此外，Sonnet 5 属于我们的 Cyber Verification Program，目前已在原生 Claude 平台、AWS 上的 Claude 平台和 Microsoft Foundry（托管在 Azure 和 Anthropic 上）上的 Claude 中可用，即将在 Google Vertex 上的 Claude 中推出。已注册 Cyber Verification Program 的组织自动获得 Sonnet 5 上的同等访问权限，无需重新申请。总体而言，我们建议需要降低安全护栏的网络安全工作使用 Claude Opus 4.8。

Sonnet 5 现在已经就绪。你可以立即开始使用它。

///

*原文来源：Anthropic，发布于 2026年6月30日。*

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业