微信扫码
添加专属顾问
我要投稿
Anthropic深夜发布Claude全新模型Fable 5,性能全面超越,开启代码与知识工作的新纪元。核心内容:1. Fable 5在主流基准测试中全面领先,代码与金融任务表现卓越2. 视觉、长上下文与记忆能力大幅提升,游戏与科学任务突破显著3. 实际应用效率惊人,能将数月工程工作压缩至以天为单位
Hello,大家好!
等啊等,终于Anthropic 发布了传了好久的Mythos 。
你很难想象,在Anthropic 优美的Haiku、Sonnet、Opus 之后,还有一个全新的模型在那儿。
这次他们发布了两个模型,Mythos 5 和Fable 5 。
这两个模型采用了同一个底座模型。
Mythos5 目前仍然只开放给受信任的合作伙伴,而Fable 5 已经在今天可以使用了。
那,我们直接进入正题,直接就端上Benchmark 跑分吧。
一句话简单概括就是,
在你脑海里出现过的主流Benchmark,Fable 5都是SOTA。
如果你觉得这些Benchmark 已经过拟合了,
那Cognition 的Frontier Code 这个测试模型在达到生产级代码标准的同时还要能完成高难度的代码任务的Benchmark 是能说明点问题了。
贵是真贵,但是效果好是真好。
根据Stripe的早期测试反馈,Fable 5 能将原本需要数月的软件工程工作压缩到以天为单位。
在一个有 5000 万行代码的 Ruby 大型代码库里,Fable 5 完成了一次全代码库范围的迁移。它只花了一天,而如果靠一个团队人工手动做,原本可能需要两个多月。
除了代码方面的表现出色,在知识工作方面,Fable 5 也一样厉害。
它在Hebbia 推出的面向资深专家级别的金融Benchmark中,Fable 5 取得了所有模型中的最高分。IMC 也指出,Fable 5 在他们的交易分析评测中几乎全项目都拿到了顶尖成绩。
同样,Fable 5 在视觉能力上也是SOTA。
过去的Claude 模型即便配上了各种辅助工具,也很难玩转宝可梦,但是Fable 5 仅仅依赖纯视觉框架,就通关了。
记忆与长上下文能力也有巨大的提升。
Fable 5在长时间运行的任务中,即便跨越了数百万token,也能保持专注。
当Anthropic 测试这个模型,让它去玩卡牌游戏《杀戮尖塔》时,给它配上了基于文化的持久化记忆功能后,它的表现提升幅度是Opus 4.8 的三倍,同时它闯进最终章的频率也达到了原来的三倍。
在分子生物学领域,Fable 5 是第一个能稳定提出新颖且有说服力的科学假说模型。
一对一的盲评测试中,Anthropic 的科学家在约80%的情况下更青睐Mythos在分子生物学方面提出的假说。
在基因组学领域的新研究中,Mythos 5 在为期一周多、基本完全自主的工作中,开展了一项新颖的基因组学研究。它整合了横跨 138 个动物物种、数以百万计细胞的单细胞数据,并自行设计、训练了一个定制的机器学习模型,用以识别在亲缘关系甚至相当疏远的不同物种中、承担相同功能角色的细胞。
仅依靠人类提供的高层次输入,Mythos 5 训练出的模型就超越了近期发表在《科学》(Science)期刊上的一个模型,尽管它的体量只有后者的百分之一。
在对齐研究中,Mythos 5 相比于其他的模型,出现失准,不对齐的行为程度很低。
这类不对齐的行为包括模型主动采取的不正当行为,以及用户在滥用模型时会予以配合。可以看到Mythos 5 确实出现不对齐的行为程度确实很低。
Section 价格和使用
Fable 5 的价格比之前大家猜测的要便宜一些,每百万token输入和输出分别时10美金和50美金。
API 中设置模型ID为claude-fable-5 就可以使用。
从今天起到6月22日,Fable 5 可以在Pro、Max 、Team 的订阅计划中使用。6月23日,将会从计划中移除,如果要使用,还需要额外购买credits。
当然,如果算力允许的话,Anthropic 会考虑延长这个窗口或者把Fable 5 纳入到订阅计划中使用。
只能说,好吧真有你的。。。
Section 彩蛋
在Anthropic 发布的官方宣传博文中,有一段是关于安全的。
Fable 5 配套了一个全新的分类器。
当这个分类器检测到与网络安全、生物化学、以及蒸馏相关的请求时,这个请求会自动交给Claude Opus 4.8 来处理。 每当这种情况时,用户都会被告知。
宁愿给你明牌降智,也要日防夜防啊,A社!
Section 一手体验
时间关系,我其实没有很深度的进行测试,我只是简单的测试了几个case。
虽然只是简单的几个,但是已经隐隐感觉到牛逼了。。。
这里放两个case:
第一个是一个Switch 游戏机的 SVG 动画。
提示词很简单,就是:
SVG Animation of nintendo switch playing pokemon
这个效果真的非常牛逼,目前为止我好像还没在别的模型上看到过效果这么好的。
第二个case 是一个四合院的3D 体素艺术。
提示词也很简单:
用HTML、CSS和JavaScript创建传统中国四合院的体素艺术作品。包含四面建筑围合的中央院落、瓦片屋顶、红色大门和传统建筑细节
注意看右上角的字体,是有设计感在的,以及白天和夜晚的丝滑转场动画。 这些我提示词压根就没有提。全是它自己悟到的。
其他的等我再深度体验体验再说吧,感觉可能这次Claude 确实有点牛逼了哦,
现在我唯一的想法是,
OpenAI什么时候把5.6 端上来!
以上,
End Note
若觉得内容有帮助,欢迎点赞、推荐、关注。别错过更新,给公众号加个星标⭐️吧!祝您在2026年里天天开心,快乐,身体健康,万事如意!期待与您的再次相遇~
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-10
更懂你的ChatGPT来了!通过做梦整理记忆,事实准确率83%
2026-06-10
Anthropic万字长文:当AI开始构建自己,人类该何去何从?
2026-06-10
Claude Fable 5正式发布 - 王者归航。
2026-06-10
什么是循环工程 Loop Engineering?loop 比 prompt 难 10 倍
2026-06-10
cc创始人对谈,Claude Code一周年回顾 :内部经历两次认知跃迁,第三次正在路上
2026-06-10
突发!Anthropic深夜发布Claude Fable 5/Mythos 5,屠榜所有基准测试
2026-06-09
仅4B大小可端侧部署!卡帕西预言的「认知模型」被国产做出来了
2026-06-09
AI应用的下半场:Agent Looping,重塑智能体的终极工作模式
2026-04-15
2026-04-07
2026-03-13
2026-03-31
2026-04-07
2026-03-17
2026-03-17
2026-03-21
2026-04-24
2026-04-17
2026-06-10
2026-06-07
2026-06-06
2026-06-03
2026-06-02
2026-06-01
2026-05-26
2026-05-23