我要投稿

跳出英伟达生态：OpenAI 发布新编程模型 GPT-5.3-Codex-Spark，速度达 1000 token每秒

发布日期：2026-02-13 09:32:23 浏览次数： 2644

作者：AGI Hunt

微信搜一搜，关注“AGI Hunt”

刚刚，OpenAI 发布了一个新的编程模型，跑在一块餐盘大小的芯片上，每秒能吐出超过 1000 个 token。

这个模型叫 GPT-5.3-Codex-Spark，是 GPT-5.3-Codex 的轻量版，专为实时编程设计。

来看对比视频：

而 Sam Altman 本人在发布前就发出了预告："It sparks joy for me"。

而让它跑这么快，秘密并非 Nvidia 的 GPU，而是 Cerebras 的晶圆级芯片。

快

传统的 AI 推理，是把模型分散到一堆 GPU 上跑，芯片之间需要频繁通信，通信就是延迟。

而 Cerebras 的 Wafer Scale Engine 3（WSE-3）走了一条完全不同的路：把整个芯片做成一整块晶圆。

而这块芯片有多大呢？

大概一个餐盘那么大。

并且，有4 万亿个晶体管。

它拥有目前所有 AI 处理器中最大的片上内存，直接消除了多芯片之间的通信开销。模型就在一块芯片上跑，不需要在芯片之间来回搬运数据。

结果就是：推理速度直接拉到每秒 1000+ token，比传统 GPU 推理快了约 15 倍。

这对于编程场景而言就是，你打字的时刻，模型已经同步写完了。

接近实时的反馈，代码就像是从指尖流出来的。

不只是快

Codex-Spark 不只是一个“跑得快的小模型”。

在 SWE-Bench Pro 和 Terminal-Bench 2.0 这两个主流的软件工程 Agent 基准测试上，Codex-Spark 的表现超过了 GPT-5.1-Codex-mini，而且完成任务的时间只有后者的零头。

又快又强！

OpenAI 对它的定位是：这是一个日常编程的生产力工具，用来做快速原型、实时协作、即时迭代。

你可以在它写代码的过程中随时打断、重新指挥方向，它几乎是瞬间响应。

而更大、更强的 GPT-5.3-Codex 则负责处理那些需要深度推理和长时间执行的复杂任务。

OpenAI 的设想是，让两个模型互补配合：Spark 负责快，Codex 负责深。

OpenAI 芯片野心

这是 OpenAI 与 Cerebras 合作的第一个里程碑。

今年 1 月，OpenAI 宣布了与 Cerebras 的多年合作计划，价值超过 100 亿美元。

而 Cerebras 也刚完成了超过 10 亿美元的融资，估值约 230 亿美元，正在考虑 IPO。

这次合作的意义，不只是一个新模型。

这是 OpenAI 在推理层面首次大规模跳出英伟达生态。

过去，几乎所有大模型公司的推理都跑在 Nvidia GPU 上，而 Codex-Spark 证明了一件事：对于特定场景（比如编程），专用芯片可以把体验拉到一个完全不同的量级。

Cerebras CTO 兼联合创始人 Sean Lie 说：

最让我们兴奋的，是与 OpenAI 和开发者社区一起探索快速推理能带来什么——新的交互模式、新的使用场景、根本不同的模型体验。这个预览版只是个开始。

Cerebras 表示，2026 年内会把这种超快推理能力扩展到最大的前沿模型上。

如何使用

目前 GPT-5.3-Codex-Spark 以 research preview 形式发布，面向 ChatGPT Pro 用户开放，可以在以下渠道使用：

Codex 应用
CLI 命令行工具
VS Code 插件

Sam Altman 坦言，发布时还有一些限制，但团队会「rapidly improve」。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-04-12

什么场景该用 AI Native？

2026-04-11

那个“爱马仕”，想拯救“智障”小龙虾

2026-04-10

重磅！Anthropic官方Harnerss发布了！

2026-04-10

刚刚，100 美金的 ChatGPT 来了

2026-04-09

技术教科书：顶级开发团队设计的Harness工程项目源码什么样

2026-04-09

Anthropic 官方 Harness 发布：全面解读 Managed Agents

2026-04-09

SDD-RIPER 团队落地指南：如何让整个团队在一周内跑通大模型编程

2026-04-09

Claude Managed Agents 公测发布！Agent 开发成本直降 500 倍

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

深度解析——为什么Claude code CEO Dario 如此反中？

2026-01-23

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

不会封号的Claude Code使用方法！已稳定测试一个月，还能共享给团队。

2026-01-14

我装了 9 个 Skill，终于看懂了 Google Antigravity 的野心

2026-01-21

Codex 独立 App 来了，这是一个新东西

2026-02-03

豆包 2.0 模型发布，全信息整理（全网最完整，另附 79 页 Model Card）

2026-02-14

OpenAI 发布新的 Codex 桌面版，我现在不骂 Codex 难用了

2026-02-03

大家都在问

什么场景该用 AI Native？

2026-04-12

12MB的Go二进制，让AI操控浏览器只花800 tokens，PinchTab凭什么这么省？

2026-04-07

华为AI 49元/月！贵？不贵？

2026-04-01

为什么这波 AI 产品都开始抢着做 CLI ？

2026-03-31

Harness Engineering 来了，SDD 还有意义吗？

2026-03-31

OpenAI不会干黄了吧？

2026-03-22

专访OpenAI首席科学家：我们离“AI自己做研究”有多远？

2026-03-22

编程选GPT-5.4，还是GPT-5.3-Codex？

2026-03-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw