2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

大神都惊了!OpenAI o3模型单挑Linux内核,竟揪出一个0-day高危漏洞

发布日期:2025-05-25 18:16:22 浏览次数: 2358
作者:AI寒武纪

微信搜一搜,关注“AI寒武纪”

推荐语

OpenAI o3模型在Linux内核中发现0-day漏洞,性能超群!

核心内容:
1. 零日漏洞的概念及o3模型在Linux内核中的应用
2. o3模型在基准测试中的表现与对比分析
3. 安全研究员Sean Heelan使用o3模型发现CVE-2025-37899漏洞的过程

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


 

零日漏洞或零时差漏洞(英语:zero-day vulnerability、0-day vulnerability)是指软件或硬件中还没有有效补丁的安全漏洞,并且其供应商通常不知晓,而零日攻击或零时差攻击(英语:zero-day exploit、zero-day attack)则是指利用这种漏洞进行的攻击。“零日”一词原指已发布零天(未公开发布)的盗版软件,后来代指修复漏洞的时间期限。由于漏洞已经被描述或被利用,留给软/硬件供应商来准备补丁的时间只有“零天”

o3模型在Linux内核的SMB实现中挖出了一个远程0-day漏洞(CVE-2025-37899)!全程只用了API,没搭任何复杂框架或Agentic框架,在基准测试中,o3表现优于Claude Sonnet 3.7达2-3倍

这两天安全研究员Sean Heelan分享了一段令人瞠目结舌的经历。他一直在审计Linux内核中的ksmbd模块(一个在内核空间实现SMB3协议的文件共享服务),本来是想从LLM工具开发中歇口气,OpenAI的o3模型发布后,他忍不住用自己之前在ksmbd中发现的漏洞来“考考”o3。

没想到,这一考,就考出了个大新闻!

一、基准测试:o3小试牛刀

Sean首先用一个他手动发现的漏洞CVE-2025-37778(姑且称之为“Kerberos认证漏洞”)来测试o3。这是一个在处理Kerberos认证路径中的“会话设置”请求时发生的UAF漏洞。

漏洞原理简述: krb5_authenticate函数在检测到会话状态为SMB2_SESSION_VALID时会释放sess->user。代码的假设是,后续要么会重新初始化sess->user,要么在返回错误后不再使用它。但事实并非如此,攻击者可以构造特定路径,使得sess->user不被重新初始化,并且在返回错误后仍被访问,导致UAF。

LLM测试设置:

  1. 1. 代码范围:Sean提取了“会话设置”命令处理函数及其调用的三层深度内的所有函数代码,再加上数据读取、请求解析、连接拆除等相关代码,总计约3.3k行C代码(约2.7万tokens)
  2. 2. Prompt核心:
    * 明确指示LLM寻找UAF漏洞。
    * 提供ksmbd的高级概述、架构和威胁模型。
    * 强烈引导LLM避免误报,宁可漏报也不要错报(虽然Sean也承认这更像一种“祈祷”)。

测试结果 (100次运行):

o3模型:8次成功找出该漏洞,66次判断无漏洞(漏报),28次误报。真实漏洞与误报比例约为1:4.5。这意味着,在这个特定实验中,最多看5个误报就能找到一个真漏洞

Claude Sonnet 3.7:100次运行中仅找到3次

Claude Sonnet 3.5:100次运行中0次找到

Sean特意强调,这个1:4.5的比例并不代表o3在整个ksmbd代码库上的表现。但关键在于,对于给定的3.3k行真实、非平凡的C代码,o3能以合理的信噪比和2-3倍于竞品的效率识别出这个UAF漏洞,这本身就是LLM能力的一大步

o3的报告风格更像人类写的漏洞报告,凝练且聚焦;而Sonnet 3.7则更像工作日志或思考流。各有优劣,但o3的输出通常因其结构和重点更易于理解

二、意外:o3独立发现0-day漏洞 (CVE-2025-37899)!

在确认o3能找到已知漏洞后,Sean加大了难度:他把ksmbd中所有命令处理相关的代码(主要在smb2pdu.c,约9k LoC),再加上连接设置、拆除、命令分发等代码,总计约12k LoC(约10万输入tokens)喂给了o3,同样运行100次。

结果呢?

对于之前的“Kerberos认证漏洞”,o3在更大的代码量下只成功找到了1次,性能有所下降。

但惊人的是,o3在其他运行的输出中,报告了一个全新的、类似的UAF漏洞!这次问题出在SMB的“logoff”(注销)命令处理中。这就是后来的CVE-2025-37899!

这个新漏洞同样是由于sess->user被释放后仍被其他线程访问导致。o3对漏洞描述:

Sean表示,读到这份报告时,他对AI工具在漏洞研究中的潜力有了新的认知。即使AI止步于此,安全研究员也应该开始思考如何将其整合进工作流。当然,1:50左右的信噪比(针对这个0-day的发现)处理起来仍有挑战,但这已是实实在在的进展。

三、o3的洞察力:甚至超越人类专家?

更有意思的一点是,当Sean最初修复那个“Kerberos认证漏洞”时,他的补丁是这样的:

-       if (sess->state == SMB2_SESSION_VALID)
-           ksmbd_free_user(sess->user);
+       if (sess->state == SMB2_SESSION_VALID) {
+           ksmbd_free_user(sess->user);
+           sess->user = NULL;
+       }

他仅仅是在释放后将sess->user置为NULL

但在阅读了o3关于logoff漏洞(CVE-2025-37899)的报告后,Sean意识到他最初的这个修复是不够的。因为SMB协议允许不同连接“绑定”到同一会话。在logoff场景下,即使sess->user被设为NULL,如果另一个线程在ksmbd_free_user之后、sess->user = NULL之前这极短的窗口期内访问sess->user,依然会出问题。Sean之前在ksmbd中利用过这个特性攻击其他漏洞,但在修复Kerberos漏洞时却忽略了这一点

回过头再看o3针对Kerberos认证漏洞的某些报告,Sean发现o3有时也犯了和他一样的错误,但在其他一些报告中,o3正确地指出了仅将sess->user设为NULL不足以修复问题,因为它考虑到了会话绑定的可能性

这意味着,如果Sean当初用o3来辅助发现和修复Kerberos漏洞,理论上他能做得比自己单独做更好!当然,他也坦言,以目前o3的误报率,要仔细甄别每一份报告并发现那个“正确”的解决方案,挑战依然巨大。但这个趋势是积极的

写在最后

Sean Heelan的经历证明,LLM在程序分析能力上已经达到了一个前所未有的、更接近人类的水平。相比符号执行、抽象解释或Fuzzing等传统技术,LLM在创造力、灵活性和通用性方面,更像一个人类代码审计员

自GPT-4以来,LLM在漏洞研究中的潜力已初现端倪,但真实世界问题的结果往往未达预期。o3的出现改变了这一点。我们现在拥有一个在代码推理、问答、编程和问题解决方面表现足够出色的模型,它能够真正提升人类在漏洞研究中的表现

o3并非完美无瑕,它仍可能产生无意义的结果,令人沮丧。但不同的是,它给出正确结果的几率已经高到值得你投入时间和精力在真实问题上尝试它。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅