我要投稿

一觉醒来，国内 AI 的天又要崩了吗？

发布日期：2025-06-11 07:42:59 浏览次数： 2234

作者：FishAI

微信搜一搜，关注“FishAI”

拖拖拉拉烟雾弹了好几天呐，o3-pro 终于发布了！

先发布后上线，不是等待名单更胜等待名单。

o3-pro 是 OpenAI 今年早些时候推出的推理模型 o3 的一个升级版本。与传统的AI模型不同，推理模型能够一步一步地解决问题，这使其在物理、数学和编程等领域表现得更为可靠。

ChatGPT Pro 和 Team 用户将今天就可以使用 o3-pro，它将取代之前的 o1-pro 模型。

企业版和教育版用户则将在下周获得访问权限，此外，今天下午，o3-pro 也已在 OpenAI 的开发者 API 中上线。

在 API 定价方面，o3-pro 的输入 token 价格为1 Million 20 美元/140 RMB，输出 token 为1 Million 80 美元/560 RMB，一百万输入 token 大约相当于 75 万个单词，比《战争与和平》的篇幅还要稍长一些。

OpenAI 在其更新日志中写道：“在专家评测中，评测人员在所有测试类别中都一致认为 o3-pro 优于 o3（我不是专家，我从名字看起来也认为 i3-por 比 o3 好），尤其是在科学、教育、编程、商业和写作辅助等关键领域。此外，评测人员在清晰度、全面性、指令遵循和准确性方面也给予了 o3-pro 一致更高分。”

据 OpenAI 介绍，o3-pro 能够调用多种工具，使其可以进行网络搜索、分析文件、理解视觉输入、使用 Python 编程、利用记忆功能实现个性化回复等等。但 OpenAI 也提到，该模型的一个缺点是，生成回复所花费的时间通常比 o1-pro 更长。

o3-pro 也存在其他一些限制。由于一个“技术问题”尚未解决，目前在 ChatGPT 中与该模型的临时聊天功能已被禁用。此外，o3-pro 无法生成图像，并且也不支持 OpenAI 的人工智能工作空间功能 Canvas。

不过，从积极的方面来看，根据 OpenAI 的内部测试，o3-pro 在多项流行的人工智能基准测试中取得了令人瞩目的成绩。在评估模型数学能力的 AIME 2024 测试中，o3-pro 的得分超过了谷歌性能顶尖的 AI 模型 Gemini 2.5 Pro。在测试博士级别科学知识的 GPQA Diamond 基准测试中，o3-pro 的表现也优于 Anthropic 公司最近发布的 Claude 4 Opus。