微信扫码
添加专属顾问
我要投稿
OpenAI 推理模型 o3-pro 强势来袭,性能升级引发行业震动。 核心内容: 1. o3-pro 作为 o3 的升级版,推理能力在多领域显著提升 2. 定价策略与性能评测结果,以及对比前代模型的优势 3. o3-pro 的功能限制与在人工智能基准测试中的卓越表现
拖拖拉拉烟雾弹了好几天呐,o3-pro 终于发布了!
先发布后上线,不是等待名单更胜等待名单。
o3-pro 是 OpenAI 今年早些时候推出的推理模型 o3 的一个升级版本。与传统的AI模型不同,推理模型能够一步一步地解决问题,这使其在物理、数学和编程等领域表现得更为可靠。
ChatGPT Pro 和 Team 用户将今天就可以使用 o3-pro,它将取代之前的 o1-pro 模型。
企业版和教育版用户则将在下周获得访问权限,此外,今天下午,o3-pro 也已在 OpenAI 的开发者 API 中上线。
在 API 定价方面,o3-pro 的输入 token 价格为1 Million 20 美元/140 RMB,输出 token 为1 Million 80 美元/560 RMB,一百万输入 token 大约相当于 75 万个单词,比《战争与和平》的篇幅还要稍长一些。
OpenAI 在其更新日志中写道:“在专家评测中,评测人员在所有测试类别中都一致认为 o3-pro 优于 o3(我不是专家,我从名字看起来也认为 i3-por 比 o3 好),尤其是在科学、教育、编程、商业和写作辅助等关键领域。此外,评测人员在清晰度、全面性、指令遵循和准确性方面也给予了 o3-pro 一致更高分。”
据 OpenAI 介绍,o3-pro 能够调用多种工具,使其可以进行网络搜索、分析文件、理解视觉输入、使用 Python 编程、利用记忆功能实现个性化回复等等。但 OpenAI 也提到,该模型的一个缺点是,生成回复所花费的时间通常比 o1-pro 更长。
o3-pro 也存在其他一些限制。由于一个“技术问题”尚未解决,目前在 ChatGPT 中与该模型的临时聊天功能已被禁用。此外,o3-pro 无法生成图像,并且也不支持 OpenAI 的人工智能工作空间功能 Canvas。
不过,从积极的方面来看,根据 OpenAI 的内部测试,o3-pro 在多项流行的人工智能基准测试中取得了令人瞩目的成绩。在评估模型数学能力的 AIME 2024 测试中,o3-pro 的得分超过了谷歌性能顶尖的 AI 模型 Gemini 2.5 Pro。在测试博士级别科学知识的 GPQA Diamond 基准测试中,o3-pro 的表现也优于 Anthropic 公司最近发布的 Claude 4 Opus。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-04
Skills使用体验
2026-02-04
AgentScope 正式发布 Skills 支持 - 实现渐进式披露
2026-02-04
从“回答者”进化为“研究员”:全面解析 Deep Research
2026-02-04
刚刚,Xcode 史诗级更新:原生集成 Claude Agent SDK,苹果开发直接起飞!
2026-02-04
国产 Cowork 它来了!MCP、Skills和Expert Agents都支持,全部免费体验!
2026-02-04
混元研究博客上线姚顺雨团队最新成果:从 Context 探索语言模型的范式转变
2026-02-04
通俗讲解大模型短期记忆 vs 长期记忆
2026-02-04
谁动了我的电脑?谁应该抱怨?
2026-01-24
2026-01-10
2025-11-19
2025-11-13
2026-01-26
2026-01-01
2025-12-09
2025-11-12
2026-01-09
2025-12-21
2026-02-04
2026-02-03
2026-02-03
2026-02-02
2026-02-02
2026-02-02
2026-01-31
2026-01-30