最强Claude意外泄露！完胜Opus 4.6，代号「卡皮巴拉」，奥特曼又要睡不着了

发布日期：2026-03-28 05:13:01 浏览次数： 2200

作者：APPSO

微信搜一搜，关注“APPSO”

就在刚刚，Anthropic 泄露了一个从未公开过的新模型。

没有小道消息铺垫，没有「知情人士透露」的前戏，Anthropic 自己的 CMS 数据库忘了关权限，近 3000 份内部文件直接躺在公网上，被《Fortune》记者翻了个底朝天。

剑桥大学网络安全研究员 Alexandre Pauwels 受邀验证了这批材料的真实性和规模。Anthropic 发言人随后向《Fortune》确认：模型确实存在。

🔗 https://m1astra-mythos.pages.dev/

这个模型叫 Claude Mythos，内部代号 Capybara（卡皮巴拉）。

它跳过了 Opus 升级版的剧本，跳过了 Sonnet 换皮的套路，直接开辟了一个凌驾于 Opus 之上的全新第四层级。Anthropic 自己在草稿里的原话：「Mythos 是一个全新层级模型的名字，比我们的 Opus 模型更大、更智能。在此之前，Opus 一直是我们最强大的模型。」

如果你觉得 Claude Opus 4.6 已经够猛了，那 Mythos 就是 Anthropic 在说：那只是热身。

Opus 之上，到底强了多少

Anthropic 现有产品线是三层结构：Haiku 最轻最快，适合轻量任务；Sonnet 居中，性价比之选；Opus 最大最强，重型推理担当。这个框架从 Claude 3 时代延续至今，行业里几乎所有人都默认 Opus 就是 Anthropic 的天花板。

Mythos 把这个天花板掀了。

泄露的草稿博文显示，与当前最强的 Claude Opus 4.6 相比，Mythos 在多个核心领域取得了「显著更高的分数」。至少覆盖了三大方向：

软件编程。这是当前 AI 模型竞争最白热化的战场。Claude Opus 4.6 本身已经是公认的编程最强模型之一，而 Mythos 在编程基准上进一步拉开了差距。对于每天用 Claude 写代码的开发者来说，这意味着一个量级的跃升，不是小数点后面的微调。

学术推理。数学、科学、逻辑推理，这些考验模型「深度思考」能力的硬骨头，Mythos 同样显著领先。草稿中特意把「学术推理」作为独立测试维度单独拎出来讲，说明 Anthropic 对这个方向的突破底气很足。

网络安全。这是最炸裂的部分。

草稿博文中有一段话，措辞之重，在 Anthropic 历来的官方叙事中极为罕见：

尽管 Mythos 目前在网络安全能力上远超任何其他 AI 模型，但它预示着即将到来的一波浪潮，届时模型将能以远超防御者努力的速度来利用漏洞。

注意用词：不是「领先」，不是「优于」，是「远超」。而且这是泄露出来的内部评估，不是市场部写的宣传稿，用词分量完全不同。

Anthropic 发言人在确认 Mythos 存在时，用了两个定性：「质的飞跃」和「迄今为止最强大的模型」。

过去两年，AI 模型的竞争一直在同一个量级上贴身肉搏。GPT 系列、Gemini、Claude、Llama，各项基准你追我赶，差距用个位数百分比来量。而 Mythos 暗示的已经不是追赶了，是变道超车。

这大概就是为什么，每次 Anthropic 有大动作，社交媒体上总有人第一时间 @Sam Altman：睡了吗？

太强了怎么办？Anthropic 的答案是：先把解药发出去

一家以「安全第一」立身的 AI 公司，在自己内部文档里承认造出了一个可能让攻击者碾压防御者的东西。这种坦率在行业里几乎没有先例。

于是 Anthropic 做了一个罕见的决定：Mythos 的第一批用户，不是开发者，不是企业客户，而是网络安全防御机构。

逻辑很简单：如果这个模型的攻击能力确实如内部评估所言，那在放给所有人之前，得先让守门的人拿到同样的武器。毒药还没散出去，解药先到位。

这在 AI 行业的发布史上几乎没有先例。OpenAI 发 GPT-4 的时候做过红队测试，Google 发 Gemini 做过安全审查，但没有哪家公司把「安全防御者优先使用」写进正式的发布路线图里。

Anthropic 这么做，要么是真的被自己造出来的东西吓到了，要么是在用一种极其高明的方式给 Mythos 的能力背书。又或者两者兼有。

与此同时，Mythos 的运行成本是另一个现实问题。草稿坦承「服务成本非常昂贵」，需要大幅优化效率才会考虑面向大众。翻译一下：这只卡皮巴拉目前是实验室里的珍稀品种，想让它走进千家万户的聊天窗口，Anthropic 还得先把饲养成本打下来。

但信号已经出去了。当竞争对手还在为 Opus 级别的模型绞尽脑汁时，Anthropic 已经在讨论 Opus 之上的东西该怎么安全地放出来了。

两家公司，撞上同一只卡皮巴拉

每个大模型都有内部代号。GPT-4 叫过 Arrakis，Google 用宝石命名。而 Anthropic 给有史以来最强模型取的代号，是一只卡皮巴拉，就是那个在互联网上以「呆萌脸 + 跟谁都能和平共处」闻名的 meme 之王。

怎么实锤的？泄露的博客有两个版本。V1 通篇用「Mythos」，V2 把每一个「Mythos」都替换成了「Capybara」，连文中每处引用都做了对应修改。说明这个模型在 Anthropic 内部相当长时间里就叫「卡皮巴拉」，「Mythos」是后来包装出来的发布名。

但 AI 圈最知名的卡皮巴拉 IP 早就有主了。阿里通义千问 Qwen 的吉祥物就是卡皮巴拉，社区里到处是卡皮巴拉头像和周边，品牌认知度拉满。

所以当 Mythos 的代号被曝光，社交媒体直接炸了。而全场最佳来自千问前技术负责人林俊旸亲自现身评论区，只留了一句：

「capybara? seriously?」

两家争夺 AI 王座的公司，不约而同看上了同一只呆头呆脑的大啮齿目。2026 年 AI 圈最有喜剧张力的一幕，大概就是这了。

最低级的配置错误扒了底裤

最后聊聊这次泄露本身，因为它的荒诞程度值得单独说。

Anthropic 把原因归结为「外部 CMS 工具中的人工配置错误」，同时特意强调跟 Claude、Cowork 或任何 AI 工具无关。后半句的急切耐人寻味：最近多家科技公司因 AI 生成代码引发技术事故频频上新闻，而 Anthropic 恰恰是那个最高调宣传用 Claude Code 自动化内部流程的公司。「不是 AI 干的」，他们显然觉得有必要把这句话说清楚。

技术本质很简单。剑桥研究员指出，CMS 系统中上传的所有资产默认公开，除非手动设为私密。Anthropic 忘了点那个开关。和 AWS S3 存储桶忘关权限一个性质的低级失误，有充分文档记录，完全可以预防。

一家正在造有史以来最强网络安全 AI 的公司，被最基础的权限配置疏忽扒了个精光。你很难想出比这更讽刺的剧本。

同一批文件里还藏着一场闭门 CEO 峰会的细节：计划在英国一处 18 世纪乡间庄园酒店举办，Anthropic CEO Dario Amodei 将出席，对象是欧洲大型企业掌门人。一场精心策划的高端商务社交，就这样和产品草稿一起被晾在了阳光下。