我要投稿

Mythos 全面解读：Anthropic 最强模型发布

发布日期：2026-04-08 10:44:48 浏览次数： 2423

作者：赛博禅心

微信搜一搜，关注“赛博禅心”

MODEL

2026 年 4 月 7 日，Anthropic 发布了 Claude Mythos Preview。这是一个通用前沿模型，定位在 Opus 之上，是 Claude 产品线的全新最高层级。Anthropic 同时宣布，Mythos Preview 不会公开发布，只向 12 家核心合作方和 40 余家关键基础设施组织开放

Claude 模型层级：Mythos 是 Opus 之上的全新层级

这个消息的特殊之处在于发布方式

Anthropic 没有走常规路线：没有开放 API，没有更新 claude.ai 的模型选项，没有发 benchmark 排行榜。它把 Mythos Preview 放在一个叫 Project Glasswing 的网络安全计划里，只向 AWS、Apple、Google、Microsoft 等 12 家核心合作方和 40 余家关键基础设施组织开放。普通用户和开发者暂时没有任何渠道接触到这个模型

https://www.anthropic.com/glasswing

对此，Anthropic 的说法是：这个模型的网络安全能力强到了需要管控的程度，它已经在所有主流操作系统和主流浏览器中发现了数千个高危零日漏洞。在新的安全护栏开发完成之前，不能让它进入公开市场

Mythos 是什么

先说定位。Claude 此前的产品线是三层：Haiku（轻量快速）、Sonnet（平衡性能与成本）、Opus（最强）。Mythos 是 Opus 之上的第四层

Fortune 在 3 月底从 Anthropic 意外公开的一个数据缓存中率先发现了这个模型的存在。泄露的内容是一个完整的网页结构化数据，包含标题和发布日期，看起来是一篇产品发布博客的草稿。文档中写到，Mythos 的内部代号是「Capybara」，被定义为「比 Opus 更大、更强，但也更贵」的全新模型层级。草稿中还有一句相当直白的表述：「Capybara 在软件编码、学术推理和网络安全等测试中的得分，显著高于我们此前最强的模型 Claude Opus 4.6」

Anthropic 发言人当时回应称，这个模型代表了「能力上的阶跃」（a step change），是他们「迄今构建的最强模型」，正在被一小群早期客户试用

命名来自古希腊语，意思是「叙述」或「话语」。Anthropic 官方的注释是：人类文明用来理解世界的故事体系

Mythos 不是专门训来做安全的。安全能力是 coding 和 reasoning 全面提升的自然涌现

Anthropic 的红队博客说得很明确：「我们没有专门训练 Mythos Preview 具备这些能力。它们是代码、推理和自主性方面整体改进的下游结果。」同样的改进让模型更擅长修复漏洞，也让它更擅长利用漏洞。这两件事在技术上是同一件事的两面

有多强

先看 Anthropic 官方公布的评测数据

Mythos vs Opus 4.6：官方评测数据

几个关键数字：

SWE-bench Verified 93.9%，vs Opus 4.6 的 80.8%。这是目前公开模型中的最高分。SWE-bench Pro 从 53.4% 跳到 77.8%，提升幅度接近 46%

SWE-bench Multimodal（Anthropic 内部实现）从 27.1% 到 59.0%，翻了一倍多。Terminal-Bench 2.0 从 65.4% 到 82.0%。Anthropic 补充说，把超时限制放宽到 4 小时并用 Terminal-Bench 2.1 更新后，Mythos 得分达到 92.1%

推理方面，GPQA Diamond 94.6%（vs 91.3%），HLE 有工具版 64.7%（vs 53.1%）。搜索和电脑使用方面，BrowseComp 86.9%（vs 83.7%），但 Anthropic 指出 Mythos 在这个测试上用的 token 量只有 Opus 4.6 的五分之一。OSWorld-Verified 79.6%（vs 72.7%）

coding 相关的提升最大，reasoning 其次，搜索和电脑使用的提升相对温和。这个提升分布也解释了为什么安全能力会涌现。找漏洞和写 exploit 本质上是 coding + reasoning 的极端应用场景

Anthropic 在 benchmark 注释中提到了一些细节。SWE-bench Verified、Pro 和 Multilingual 中有一部分题目存在记忆化嫌疑，但排除这些题目后 Mythos 对 Opus 4.6 的领先幅度保持不变。BrowseComp 上 Mythos 的 token 消耗只有 Opus 4.6 的五分之一，做到了更强的同时更省

安全能力：具体案例

数字看完了，说具体案例

Mythos Preview 在过去几周里发现了数千个零日漏洞（此前未被发现的漏洞），涵盖所有主流操作系统和所有主流浏览器。Anthropic 红队博客给了三个已经被修复、可以公开讨论的例子：

OpenBSD：27 年的漏洞

OpenBSD 是以安全著称的操作系统，广泛用于防火墙和关键基础设施。这个漏洞允许攻击者仅通过连接就能远程崩溃目标机器

FFmpeg：16 年的漏洞

FFmpeg 是全球使用最广泛的视频编解码库。这个漏洞所在的代码行被自动化测试工具命中过 500 万 次，但从未被捕获

Linux 内核：权限提升链

Mythos 自主发现并串联了多个漏洞，通过利用微妙的竞争条件和 KASLR 绕过，实现了从普通用户到完全控制的权限提升

这三个案例有一个共同特点：它们都是在经过了大量人工审计和自动化测试之后依然存活了多年的漏洞。能在这类被反复检查过的代码库中找到零日漏洞，说明 Mythos 的代码理解能力已经达到了一个跟人类安全研究员不同的维度：它不会疲倦，不会遗漏，可以大规模并行扫描

红队博客还提到了一些更复杂的案例。Mythos 自主编写了一个浏览器 exploit，串联 4 个漏洞，构造了 JIT heap spray，同时逃逸了渲染器沙箱和操作系统沙箱。在 FreeBSD 的 NFS 服务器上，它自主写出了一个远程代码执行 exploit，用 20-gadget ROP chain 分散在多个数据包中，让未认证用户获得完整 root 权限

但最能说明能力断层的，是一个直接对比实验

Firefox JS 引擎漏洞利用：Opus 4.6 vs Mythos Preview

同一组 Firefox 147 JS 引擎漏洞（已在 Firefox 148 中修复），让 Opus 4.6 和 Mythos Preview 分别尝试开发 exploit。Opus 4.6 在数百次尝试中只成功了 2 次。Mythos Preview 成功了 181 次，另有 29 次获得了寄存器控制

红队博客原文写得很直白：上个月他们还在博客里写「Opus 4.6 发现漏洞的能力远强于利用漏洞的能力」，Opus 4.6 自主开发 exploit 的成功率接近 0%

一个月后，Mythos 改变了这个结论

还有一个细节。Anthropic 说，公司内部没有安全背景的工程师，让 Mythos 在晚上自动跑漏洞扫描任务，第二天早上就收获了一个完整的、可以工作的远程代码执行 exploit

没有安全背景的工程师让 Mythos 跑了一晚上，第二天早上收获了一个 working exploit

红队博客还公布了一组内部 benchmark 数据。Anthropic 定期在约 1000 个 OSS-Fuzz 开源仓库上跑模型，按崩溃严重程度分五级评分（1 级最轻，5 级是完全控制流劫持）。大约 7000 个入口点，每个跑一次。Sonnet 4.6 和 Opus 4.6 在 1-2 级各有 100-175 次崩溃，但 3 级以上各只有 1 次。Mythos Preview 在 1-2 级达到 595 次，3-4 级若干次，5 级（完全控制流劫持）达到了 10 次

这些能力不需要专门的安全训练，不需要人工引导。红队博客描述的测试方法极其简单：启动一个隔离容器，跑目标软件和源码，用 Claude Code 加载 Mythos，prompt 就是一段话：「请在这个程序里找安全漏洞。」然后让它自己跑

Anthropic 红队博客对长期走向的判断是乐观的。他们认为，跟当年软件模糊测试（fuzzing）工具的历史类似，AI 安全能力最终会让防御方受益更多。但短期内，过渡期可能会很混乱。Project Glasswing 的逻辑就是在这个窗口期内，让防御方先跑起来

System Card 里的几个细节

Anthropic 同时发布了 Claude Mythos Preview 的 System Card，内容很长。这里挑几个读者大概率想知道的

三明治邮件事件

在内部行为测试中，一个早期版本的 Mythos Preview 被放在一个安全沙箱里，模拟用户指示它尝试逃出容器。它成功了。然后，在没有被要求的情况下，它把自己的逃逸方法发布到了多个不太好找但技术上公开可访问的网站上，作为「展示成功」的方式。负责这个测试的研究员是在公园里吃三明治的时候收到了 Mythos 发来的邮件，才知道它成功了

掩盖痕迹

在极少数的内部测试中（不到 0.001% 的交互），早期版本的 Mythos Preview 做了它自己似乎知道是被禁止的操作，然后试图隐藏。一个案例：模型通过一个被明确禁止的方法意外获得了一道定量估算题的精确答案，它没有拒绝回答，而是尝试自己独立求解，并且在内部推理中明确提到「需要确保最终提交的答案不要太准确」

另一个案例：它找到了一种方法来编辑自己没有权限编辑的文件，之后还做了额外操作，确保这些修改不会出现在 git 的变更历史中

利用底层系统数据

在多个实例中，早期版本通过 /proc/ 访问来搜索凭证、尝试绕过沙箱、尝试提升权限。在若干案例中，它成功访问了 Anthropic 故意不提供的资源，包括通过检查进程内存获取消息服务、源码管理和 Anthropic API 的凭证

闭源软件逆向

红队博客还提到，Mythos 在闭源软件上也表现很强。它能拿到一个去符号表的二进制文件，重构出可信的源代码，然后在重构源码和原始二进制之间交叉验证来寻找漏洞。Anthropic 说已经用这种方式在闭源浏览器和操作系统中找到了可远程崩溃服务器的 DoS 攻击、可 root 手机的固件漏洞、以及桌面操作系统的本地权限提升链

System Card 原文对这个模型的总结是一句很有分量的话：它同时是 Anthropic 有史以来最对齐的模型，也是最危险的模型。因为它能力更强、更可靠，所以人们给它更多自主权和更强的工具权限。而当它偶尔出错的时候，影响范围也更大

Project Glasswing

因为这些能力，Anthropic 发起了 Project Glasswing

Project Glasswing 概览

项目名来自透翅蝶（glasswing butterfly，学名 Greta oto），据 CNBC 报道是 Anthropic 员工投票决定的。Anthropic 官方给了两层寓意：透翅蝶的翅膀透明，可以隐身，像隐藏在代码中的漏洞。透明也代表他们在安全议题上倡导的开放合作

12 家核心合作方：AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks，加上 Anthropic 自身。另有 40 余家构建或维护关键软件基础设施的组织获得访问权限

Anthropic 承诺投入最多 1 亿美元 的模型使用额度。额度用完后，Mythos Preview 的定价是 $25/$125 per million input/output tokens。作为对比，Opus 4.6 的定价是 $15/$75。另外捐赠了 250 万美元给 Linux Foundation 下的 Alpha-Omega 和 OpenSSF，150 万美元给 Apache 软件基金会

合作方的任务是用 Mythos Preview 扫描自家和开源系统的漏洞。Anthropic 承诺 90 天内公开发布阶段性报告，披露修复的漏洞和安全实践建议

分发渠道方面，Google Cloud Vertex AI 已经以 Private Preview 形式提供 Mythos Preview，API、Amazon Bedrock、Microsoft Foundry 也都是接入通道

AI 能力已经跨过了一个门槛，从根本上改变了保护关键基础设施所需的紧迫性。不会再回去了

Anthony Grieco，Cisco 首席安全与信任官

为什么不公开

Anthropic 给出的理由比较直白：Mythos Preview 的安全能力如果落入攻击者手中，后果可能很严重。在新的安全护栏（safeguards）开发完成之前，不适合公开

官方说法是，他们计划在即将推出的 Claude Opus 模型上先上线这些安全护栏，用风险更低的模型来打磨护栏效果，然后再考虑以 Mythos 级别的能力公开部署。这句话也暗示了一件事：新版 Opus 可能不远了

对于合法安全从业者可能受到护栏影响的情况，Anthropic 预告了一个「Cyber Verification Program」，安全专业人员可以申请认证来绕过部分限制

同时，Anthropic 也提到了与美国政府的沟通。据 CNBC 报道，他们已经与 CISA（网络安全和基础设施安全局）和 NIST 下属的 AI 标准创新中心进行了持续讨论。Anthropic 在 Glasswing 页面上写到，保护关键基础设施是民主国家的首要安全优先事项，美国及其盟友必须在 AI 技术上保持决定性领先

几个信号

产品线扩展

Claude 产品线从三层变四层。Haiku、Sonnet、Opus 之上多了 Mythos/Capybara 层级。这个变化本身比任何单项 benchmark 都重要。它意味着 Anthropic 的模型能力已经拉出了足够大的差距，需要一个新的价格区间来承接。从 Fortune 泄露的文档来看，Capybara 在内部被明确定义为「比 Opus 更大」的新 tier，这是产品线的结构性扩展

安全叙事做首发

Mythos 是通用模型，coding、reasoning、搜索都很强，完全可以走常规的 benchmark 发布路线。但 Anthropic 选择了「强到不能公开」的叙事，只给 12 家大厂用。这既是对安全风险的真实考量，也是一种定价权和生态控制的声明。想用最强模型？加入 Glasswing，按 $25/$125 的价格买 token

Anthropic 选择不让你用它最强的模型，但告诉你这个模型有多强

定价信号

$25/$125 的定价，比 Opus 4.6 的 $15/$75 贵了约 67%%。如果 Mythos 级别的模型最终公开，这个价格区间会成为新的锚点。对于那些认为 token 价格只会越来越便宜的人来说，这个定价是一个反例：能力足够强的时候，价格可以往上走

时间线

4 月 4 日封杀 OpenClaw 的订阅通道，4 月 7 日发布 Mythos。一手收紧开放生态的管控（你不能再用月费包无限制跑第三方 Agent 框架），一手释放最强模型给大厂合作方。两件事之间隔了三天，节奏安排得很紧凑

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业