微信扫码
添加专属顾问
Claude Sonnet 5 以 Opus 级智能实现突破,却维持 Sonnet 级价格,为开发者带来前所未有的成本效益。 核心内容: 1. Sonnet 5 在Agentic能力上的关键提升与安全评估 2. 对比前代及Opus模型的性能与成本优势分析 3. 模型的具体定价策略与获取方式
PART 01
Claude Sonnet 5 被定位为 Anthropic 迄今为止最具 agentic 能力的 Sonnet 模型。它能够制定计划、调用浏览器和终端等工具,并以自主方式执行复杂任务——而在短短几个月前,这类能力还需要更大、更昂贵的模型才能实现。
对许多开发者而言,agentic AI 时代正是从 Sonnet 级模型开启的:Claude Sonnet 3.5、3.6 和 3.7 是第一批在编码和工具使用方面展现出惊人能力的模型。但在此之后,agentic 能力最显著的提升集中在了 Opus 级模型上。
Sonnet 5 缩小了这一差距。它的性能接近 Opus 4.8,但价格更低。与前代 Sonnet 4.6 相比,Sonnet 5 在推理、工具使用、编码和知识工作等 agentic 性能的关键维度上都有大幅提升。
我们的安全评估发现,Sonnet 5 的不良行为率总体低于 Sonnet 4.6,在 agentic 场景中使用更加安全。同时,评估也显示它在网络安全任务上的能力远低于当前的 Opus 模型。
从今天起,Claude Sonnet 5 已在所有计划中开放使用。Free 和 Pro 计划的用户将直接使用 Sonnet 5 作为默认模型,Max、Team 和 Enterprise 用户也可以使用它。Claude Code 和 Claude 平台同样支持该模型。Claude 平台上线时提供限时优惠价格:每百万 input tokens 2 美元(约 14.4 元人民币)、每百万 output tokens 10 美元(约 72 元人民币),有效期至 2026 年 8 月 31 日。之后将恢复标准价格:每百万 input tokens 3 美元(约 21.6 元人民币)、每百万 output tokens 15 美元(约 108 元人民币)。开发者可通过 Claude API 使用 claude-sonnet-5 模型。
PART 02
下面两张图表展示了 Sonnet 5 在不同 effort 级别下的表现,分别对应 agentic 搜索评估 BrowseComp 和计算机使用评估 OSWorld-Verified。
Sonnet 5(橙色线)相比 Sonnet 4.6(灰色线)实现了全面超越,并且比 Opus 4.8(黄色线)提供了更宽泛的成本-性能选择区间。在中等 effort 级别下,Sonnet 5 的成本效率显著提升;在高 effort 级别下,它的部分任务表现甚至可以匹敌 Opus 4.8。用户可以在 Sonnet 5 和 Opus 4.8 之间通过调整 effort 级别,找到成本与性能的最佳平衡点。
图表中的价格基于 Sonnet 5 的标准定价(每百万 input tokens 3 美元、每百万 output tokens 15 美元)。在 8 月 31 日前的限时优惠期间(每百万 input tokens 2 美元、每百万 output tokens 10 美元),Sonnet 5 的实际成本比图表所示更低。Opus 4.8 的定价为每百万 input tokens 5 美元、每百万 output tokens 25 美元。
合作伙伴的早期反馈高度一致:Sonnet 5 的 agentic 能力远超前代。测试者描述了它如何完成前代 Sonnet 模型会中途放弃的复杂任务、如何在未被要求的情况下主动检查自身输出,以及如何以极具吸引力的价格完成所有这些 agentic 工作。
Cursor — Zimu Li(技术团队成员):"Claude Sonnet 5 为我们的 agent 提供了强大的多步骤软件工程执行层。它在复杂的混乱技术环境中出色地完成持续编码、工具使用和调试,对需要执行力和技术根基的工作流尤其有用。"
Glean — Daniel Shepard(高级工程师):"我们给 Claude Sonnet 5 交了一个两步任务——更新 Salesforce 账户层级、向企业联系人发送上线公告——它端到端完成了。以前这类任务通常会卡在中途。对于日常自动化来说,这是个不需要思考的选择。"
Lovable — Fabian Hedin(联合创始人):"Claude Sonnet 5 用更少的步骤完成了同样的事。输出质量不变,但过程更简洁。它也能干净利落地拒绝不安全的请求。在 Lovable,我们将强大的工具交到数百万构建者手中。一个知道何时说'不'的模型和一个知道如何构建的模型同样重要。"
Sourcegraph — Yusuke Kaji(AI for Business 总经理):"我们将 Claude Sonnet 5 投入数十个最具挑战性的真实 Pull Request 中,它每次都独立完成了从处理到测试验证的全流程——让工程师们专注于判断、决策和最终审批。"
CodeRabbit — Neel Chotai(Rust 工程师兼软件工程师):"我让 Claude Sonnet 5 调查一个 bug。它在没有被提示的情况下,自发编写了复现测试、实现了修复,然后暂存代码以确认没有修复时 bug 会复现。整个流程一次完成。"
Warp — Sualeh Asif(联合创始人):"有了 Claude Sonnet 5,agent 能遵循计划、遵守规范、交付干净的多步骤变更,而且成本高效。"
Electric — Dominic Elm(创始工程师):"Claude Sonnet 5 在存量代码上表现最佳——竞态条件、隐藏测试、那些没人想碰的部分。它能追溯故障的真实根因,交付持久修复,而不是修补症状。"
Eve — Mauricio Wulfovich(Staff ML 工程师):"Claude Sonnet 5 位于 Eve 律所诉讼任务的帕累托前沿。我们在法律研究和分析方面看到了最明显的提升,性价比优势让迁移决策变得轻松。"
ClickHouse — Ryadh Dahimene(AI/ML 产品总监):"ClickHouse agent 实时探索数据并即时生成洞察,测试新模型时,获取洞察的速度至关重要。Claude Sonnet 5 的推理步骤更紧凑,让用户更快得到答案。这种速度差异是客户能感受到的。"
Pace — Eric He(技术团队成员):"在 Pace,我们的 computer-use agent 在运营团队已有的系统上运行保险工作流——提交受理、首次损失通知、损失记录。Claude Sonnet 5 始终采取正确的操作并且速度很快,这正是真实保险工作所要求的。"
PART 03
我们的部署前安全评估发现,Sonnet 5 在安全性上总体优于 Sonnet 4.6。在 agentic 安全方面,该模型更擅长拒绝恶意请求和抵御 prompt injection 攻击中的劫持尝试。Sonnet 5 的幻觉率和谄媚率也低于 Sonnet 4.6。
在我们的自动化行为审计中——该审计测试了包括滥用协作和欺骗在内的多种不对齐行为——Sonnet 5 的总体得分更低(即更安全)。不过,与更强大的 Opus 4.8 和 Claude Mythos Preview 相比,Sonnet 5 在这项评估中显示出稍高的不对齐行为率。
我们并未刻意训练 Sonnet 5 执行网络安全任务。它可以完成一些常规的、无害的网络任务,但在测试潜在危险网络技能的评估中——例如开发软件漏洞利用——它的表现远低于 Opus 4.8 和 Mythos 5 等模型。
在一项测试模型开发 Firefox 浏览器漏洞利用能力的评估中(该评估由我们与 Mozilla 合作开发,所有漏洞已在 Firefox 148 中修补),Sonnet 5 始终未能开发出完整的可用漏洞利用,但其部分成功率比 Sonnet 4.6 略高。后者的提升可能源于通用智能的提升,而非特定训练。
由于 Sonnet 5 在这些任务上比前代略有增强,我们默认启用了网络安全保护措施来发布该模型。这些保护措施能够实时检测并拦截危险的网络使用行为,与 Claude Opus 4.7 和 4.8 中的措施相同(因为我们判断 Sonnet 5 的整体网络安全风险较低,所以保护措施不如 Fable 5 那样严格,后者拦截的网络安全任务范围更广)。
我们对 Sonnet 5 在多项安全和能力评估中的完整评估结果已发布在 Claude Sonnet 5 System Card 中。
PART 04
Claude Sonnet 5 今天起在所有平台上可用。限时优惠价格为每百万 input tokens 2 美元(约 14.4 元人民币)、每百万 output tokens 10 美元(约 72 元人民币),有效期至 2026 年 8 月 31 日。之后恢复标准价格:每百万 input tokens 3 美元(约 21.6 元人民币)、每百万 output tokens 15 美元(约 108 元人民币)。
我们已提高 Chat、Cowork、Claude Code 和 Claude 平台的速率限制,以适应更高 effort 级别带来的更高 token 使用量。用户可以根据具体项目需求选择合适的 effort 级别。
关于定价的一个细节:Sonnet 5 是 Sonnet 4.6 的升级版,但使用了更新的 tokenizer,改变了模型处理文本的方式以提升性能(这与我们在 Claude Opus 4.7 中引入的 tokenizer 变更类似)。权衡在于,相同的输入可能映射为更多的 tokens:根据内容类型不同,大约为 1.0 到 1.35 倍。限时优惠价格的设定确保了向 Sonnet 5 过渡的成本大致持平。
此外,Sonnet 5 属于我们的 Cyber Verification Program,目前已在原生 Claude 平台、AWS 上的 Claude 平台和 Microsoft Foundry(托管在 Azure 和 Anthropic 上)上的 Claude 中可用,即将在 Google Vertex 上的 Claude 中推出。已注册 Cyber Verification Program 的组织自动获得 Sonnet 5 上的同等访问权限,无需重新申请。总体而言,我们建议需要降低安全护栏的网络安全工作使用 Claude Opus 4.8。
Sonnet 5 现在已经就绪。你可以立即开始使用它。
///
*原文来源:Anthropic,发布于 2026年6月30日。*
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-07-01
一文了解|SkillScan 智能体技能安全扫描最佳实践
2026-07-01
协作的逆向演进:从 Agent 逻辑重构团队管理
2026-07-01
港科大郭毅可谈Agentic AI时代的核心命题:人机共生,人不可能退场
2026-07-01
Sonnet 5终于来了,然而Opus 4.8现在有点尴尬
2026-07-01
AI可观测性:Prompt、Tool Call、Trace、Token全链路追踪
2026-07-01
AI Infra 全景图:Agent Framework、调度、编排、沙箱、记忆管理、Tracing 分层拆解
2026-07-01
Claude Science发布:60+科学数据库一个对话搞定
2026-07-01
AI 的向量空间里藏着心理学,这是一场嵌入模型的情绪对决
2026-04-15
2026-04-07
2026-04-07
2026-04-24
2026-04-17
2026-04-05
2026-04-05
2026-04-14
2026-04-24
2026-04-22
欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。
在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。
一、 定义
本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。
会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。
知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。
二、 账号注册与登录
登录方式:本网站支持以下登录方式,您可根据实际情况选择:
微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。
手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。
账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。
实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。
未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。
三、 服务内容与规范
知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。
服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。
禁止行为:您在使用服务时不得实施以下行为:
利用技术手段批量爬取、下载、转存知识库内容;
将知识库内容用于商业目的或未经授权地向第三方传播;
干扰本网站正常运行或侵犯其他用户合法权益;
发布违法违规信息或从事违反公序良俗的活动。
四、 知识产权声明
权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。
有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。
侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。
五、 个人信息保护
我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。
您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。
您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。
六、 免责声明
内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。
不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。
第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。
七、 违约责任
如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。
如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。
八、 法律适用与争议解决
本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。
因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。
九、 其他
本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。
本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。
我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。