微信扫码
添加专属顾问
我要投稿
OpenAI 推理模型 o3-pro 强势来袭,性能升级引发行业震动。 核心内容: 1. o3-pro 作为 o3 的升级版,推理能力在多领域显著提升 2. 定价策略与性能评测结果,以及对比前代模型的优势 3. o3-pro 的功能限制与在人工智能基准测试中的卓越表现
拖拖拉拉烟雾弹了好几天呐,o3-pro 终于发布了!
先发布后上线,不是等待名单更胜等待名单。
o3-pro 是 OpenAI 今年早些时候推出的推理模型 o3 的一个升级版本。与传统的AI模型不同,推理模型能够一步一步地解决问题,这使其在物理、数学和编程等领域表现得更为可靠。
ChatGPT Pro 和 Team 用户将今天就可以使用 o3-pro,它将取代之前的 o1-pro 模型。
企业版和教育版用户则将在下周获得访问权限,此外,今天下午,o3-pro 也已在 OpenAI 的开发者 API 中上线。
在 API 定价方面,o3-pro 的输入 token 价格为1 Million 20 美元/140 RMB,输出 token 为1 Million 80 美元/560 RMB,一百万输入 token 大约相当于 75 万个单词,比《战争与和平》的篇幅还要稍长一些。
OpenAI 在其更新日志中写道:“在专家评测中,评测人员在所有测试类别中都一致认为 o3-pro 优于 o3(我不是专家,我从名字看起来也认为 i3-por 比 o3 好),尤其是在科学、教育、编程、商业和写作辅助等关键领域。此外,评测人员在清晰度、全面性、指令遵循和准确性方面也给予了 o3-pro 一致更高分。”
据 OpenAI 介绍,o3-pro 能够调用多种工具,使其可以进行网络搜索、分析文件、理解视觉输入、使用 Python 编程、利用记忆功能实现个性化回复等等。但 OpenAI 也提到,该模型的一个缺点是,生成回复所花费的时间通常比 o1-pro 更长。
o3-pro 也存在其他一些限制。由于一个“技术问题”尚未解决,目前在 ChatGPT 中与该模型的临时聊天功能已被禁用。此外,o3-pro 无法生成图像,并且也不支持 OpenAI 的人工智能工作空间功能 Canvas。
不过,从积极的方面来看,根据 OpenAI 的内部测试,o3-pro 在多项流行的人工智能基准测试中取得了令人瞩目的成绩。在评估模型数学能力的 AIME 2024 测试中,o3-pro 的得分超过了谷歌性能顶尖的 AI 模型 Gemini 2.5 Pro。在测试博士级别科学知识的 GPQA Diamond 基准测试中,o3-pro 的表现也优于 Anthropic 公司最近发布的 Claude 4 Opus。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-30
大模型的“思维链”(Chain-of-Thought):AI 是怎么一步步“推理”的
2025-08-30
Agentic AI与WorkFlow的相互成就
2025-08-29
刚刚,xAI 发布 Grok Code Fast 1 编程模型,快、便宜、免费
2025-08-29
大模型时代有了自己的「价值高速公路」
2025-08-29
A I智能革命——上下文工程新突破
2025-08-29
知识库检索准不准,关键看模型选没选对!一份评测指南请收好
2025-08-29
我如何用Prompt工程将大模型调教成风控专家
2025-08-29
度小满金融大模型技术创新与应用探索
2025-08-21
2025-06-21
2025-08-21
2025-08-19
2025-06-07
2025-06-12
2025-06-19
2025-06-13
2025-07-29
2025-06-15
2025-08-28
2025-08-28
2025-08-28
2025-08-28
2025-08-27
2025-08-26
2025-08-25
2025-08-25