免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


GPT‑5-Codex 发布:OpenAI 的 Claude Code

发布日期:2025-09-16 10:43:01 浏览次数: 3288
作者:赛博禅心

微信搜一搜,关注“赛博禅心”

推荐语

OpenAI发布GPT-5-Codex,专为代理式编程优化,性能大幅提升,代码审查能力更强,开发者体验全面升级。

核心内容:
1. GPT-5-Codex的性能优势与基准测试结果
2. 代码审查能力的显著提升与前端任务处理
3. Codex工具链的全面更新与开发者体验优化

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
长话短说
这是 OpenAI 版本的 Claude Code
安装方法是
$ npm i -g @openai/codex

原始报道在这里

https://openai.com/index/introducing-upgrades-to-codex/

Codex Hero Image
Codex 迎来重磅升级

Codex 这可以看作是 OpenAI 版的 Claude Code,然后还有独立的 WebUI

升级后的 Codex 速度更快、更可靠,在实时协作和独立处理任务方面表现更出色。无论是在终端、IDE、网页,甚至手机上,它都能大显身手


 安装方法 
$ npm i -g @openai/codex

 在线使用 
https://chatgpt.com/codex


赛博禅心之前的报道:
Agent" data-itemshowtype="0" linktype="text" data-linktype="2">Codex 实测:OpenAI 的云端 Coding Agent
GPT-5-Codex 介绍

GPT-5-Codex 是 GPT-5 的一个特殊版本,专门针对 Codex 中的代理式编程进行了优化。它专注于处理真实的软件工程工作,比如从零开始构建项目、添加功能和测试、调试、大规模重构以及代码审查。它的可控性更强,能更好地遵循指令,生成的代码质量也更高

性能与基准测试

在代码重构任务上,GPT-5-Codex 的准确率(51.3%)远超标准版 GPT-5(33.9%),在 SWE-bench 验证集上有所提升

Performance Benchmark Chart

GPT-5-Codex 能根据任务复杂性动态调整“思考”时间。处理小请求时反应更快,而对于大型重构等复杂任务,则会投入更长时间,测试中甚至能独立工作超过7小时

Token Usage Chart
代码审查能力

GPT-5-Codex 经过专门训练,能有效发现代码中的关键缺陷。它不仅能理解 PR 的意图,还能分析整个代码库和依赖关系,以及执行代码和测试来验证行为。在评估中,它的错误评论率仅为 4.4%(GPT-5 为 13.7%),而高影响力评论占比则达到了 52.4%(GPT-5 为 39.4%)

Code Review Performance Chart

它在前端任务上也同样可靠,能处理你提供的图片或截图作为输入,并在工作中向你展示截图,迭代改进

Codex 工具链全面更新
  • Codex CLI:
    工作流整个重构了,现在支持在命令行中附加图片(截图、线框图等),还带有to-do list、联网搜索等工具
  • Codex IDE 扩展:
    将 Codex 代理带入 VS Code、Cursor 等编辑器中,可以无缝预览本地更改,并利用打开的文件等上下文信息,让提示更简短,响应更快
  • Codex Cloud:
    基础设施性能大幅提升,任务完成时间中位数缩短了 90%,能自动设置环境、安装依赖,还能在云端浏览器中工作并截图反馈
  • 代码审查功能:
    开启后,Codex 会自动审查 GitHub 仓库的 PR。你也可以通过 `@codex review` 手动触发,甚至给出具体指令,如“审查安全漏洞”
开发者怎么说?

“我需要为发布一个功能而更新另一个团队的代码库。有了 Codex,我把重构和测试生成的工作交给了它,自己则专注于其他优先事项。它生成了高质量、经过充分测试的代码,让我能快速交接——保证了功能按时上线,且没有增加风险。”

— Tres Wong-Godfrey, Tech Lead at Cisco Meraki

安全与信任

Codex 的构建以安全为核心。默认情况下,它在禁用了网络访问的沙盒环境中运行。在执行潜在危险操作前会请求许可,开发者可以根据风险承受能力自定义安全设置。当然,官方始终鼓励开发者在使用前审查代理的工作

定价和可用性

Codex 已包含在 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 会员用量中。Business 和 Enterprise 可以购买额度,GPT-5-Codex 也计划很快在 API 中提供。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询