2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

OpenAI深夜引爆GPT-5.6,三箭齐发全面围剿Anthropic

发布日期:2026-06-27 09:40:33 浏览次数: 1511
作者:BubbleBrain

微信搜一搜,关注“BubbleBrain”

推荐语

OpenAI深夜发布GPT-5.6,三款新模型在性能、科研与安全上全面超越前代,直指竞争对手Anthropic。

核心内容:
1. GPT-5.6三个版本(Sol、Terra、Luna)的性能定位与跑分突破
2. 模型在生物科研、网络安全场景下的能力提升与性价比
3. 为应对安全挑战投入的自动化与人工红队测试

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
Hello,大家好! 
我是真没想到OpenAI会赶着周五把GPT5.6发布了,因为之前就有消息说是这周发不了,因为Fable 5那件事,要推迟的。
然后我兴致勃勃的打开官网一看,尼玛,果然还用不上目前只对指定的合作伙伴和企业开放

虽然我们还用不上,但不如提前了解一下新一代的GPT-5.6的能力吧。 

这次一共发了三个版本,Sol、Terra、Luna。 

「Sam 你小子,也开始跟着Anthropic 造概念了是吧」

Sol 最牛逼,我理解就是以前的Pro,Terra 是中等、Luna 是又快又便宜,我理解就跟之前的mini版本差不多。 

再看跑分。 

大家熟悉的Coding Benchmark,TerminalBench 2.1,


新一代的GPT-5.6已经刷爆了。。。

GPT-5.6 Sol的跑分已经比Anthropic 的Mythos 5 高了。甚至如果把推理模式开到新增的Ultra的话,分数已经超过了90%。

这是什么概念呢?

如果一个Benchmark 让模型能够刷到超过90%的话,就意味着这个Benchmark 基本不可用了。  

在生物方向上,GPT-5.6也有足够的进步。 


GeneBench V1是一个面向长周期基因组学和定量生物分析任务

GPT-5.6 Sol在输出相同数量的token时,分数已经超过了前代的GPT-5.5了。  


在同样的成本条件下,GPT-5.6 Sol和GPT-5.6 Terra 的表现也仍然比GPT-5.5更好。 

这也就意味着,新一代的GPT-5.6 在面对科研场景的时候,性价比更高。对很多实验室和科研团队来说,会直接影响他们是否把新一代的模型接入到自己的工作流中来。 

然后就是网络安全了。 

大概率是因为之前Anthropic那档子烂事,OpenAI发布的博客里,花了大量的笔墨来写新一代模型在安全防御上的能力。  


在ExploitBench 上,GPT-5.6 Sol 用了相比于Mythos 少超级多数量的Tokens,就逼近了它的能力。 

还有OpenAI和UC Berkeley 研究者们合作的新Benchmark,ExploitGym,


GPT-5.6 的三个模型都展示了随着推理能力的增加而能进一步提升安全能力。 

另外,OpenAI甚至投入了70万个A100等效GPU小时来用于自动化红队测试,目标是寻找通用型越狱攻击。

也就是说可以在多种提示词或不同上下文中都能生效的攻击方式,而不是只在某个单一场景下有效的攻击。 

此外,还与第三方的测试人员合作,进行了大量人类专家参与的红队测试。人类红队测试补充了自动化测试,让整个防护机制更加全面。  

最后是价格和开放。 

GPT-5.6 目前还只是预览阶段。只能通过API的方式给指定的合作伙伴开放。具体什么时候能在ChatGPT、Codex 以及API开放给更多的用户,时间还不知道。  

价格上,GPT-5.6 Sol 每一百万的token 输入输出分别对应 5刀、30刀。Terra 的价格是2.5刀、15刀。Luna 是最便宜的,在1刀和6刀。 

GPT-5.6 还引入了更可预测的提示缓存机制,包括支持显式缓存断点,以及至少 30 分钟的缓存有效期。

对于 GPT-5.6 及后续模型,缓存写入的计费为模型未缓存输入价格的 1.25 倍,而缓存读取仍然享受 90% 的输入折扣。 

还有就是OpenAI预计在7月份,会在Cerebras上搞一个更快速的GPT-5.6 Sol,速度可以达到每秒750个tokens。 

好啦,今天的分享就先到这儿了。

那现在我只关心的是, 

这么强的模型,什么时候能够让所有人都能用上呢?  

以后模型的发布流程可能都会以这种方式发布了吧我想🤔

以上, 

若觉得内容有帮助,欢迎点赞、推荐、关注。别错过更新,给公众号加个星标⭐️吧!祝您在2026年里天天开心,快乐,身体健康,万事如意!期待与您的下次相遇~


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询