微信扫码
添加专属顾问
我要投稿
几乎是毫无预兆,
OpenAI发布OpenAI o1模型,也就是之前所谓的草莓Q模型,它的能力比4o提升了一大截:
o1是一个通过强化学习训练的大型语言模型,分为两个模型,o1预览版和o1 mini,o1 mini版是一个高效、紧凑且经济的模型,推理能力强但普通知识比较弱。
o1预览版每周30条,o1-mini每周50条。
o1显著的特点是具备"思考链"(Chain of Thought)能力。
分解复杂问题:o1能够将一个复杂的问题分解为多个子步骤,然后逐步解决。
自我纠错:在推理过程中,o1能够识别并纠正自己的错误,这大大提高了最终结果的准确性。
尝试多种方法:当一种方法不奏效时,o1能够尝试不同的解题策略,这种灵活性使其能够处理各种各样的问题。
透明的推理过程:o1能够清晰地展示其推理过程,这不仅提高了结果的可解释性,也为进一步改进模型提供了宝贵的洞察。
目前我的Plus账号已经推送了o1-mini和o1-preview的模型。
其他资讯都大同小异,
下面我用著名的海龟汤问题来测试下模型的能力。
接来下我喂给o1几个案例,然后再用一个新的案例考考他:
故事:
一个女人死了,警察在房间发现了很多条这样的字条。
你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\"你太令我失望了,我永远也不会回来了\"\n\n哎,我知道我遇到麻烦了。"
可以看到o1的思考步骤,每次回答基本都会调用内部的推理流程,一开始就花了15秒:
它的问题太让我吃惊了,每个问题都精准的问到点子上,太吓人了:
随着推理的深入,o1的思考时间会变长,思考的步骤逻辑会发生变化和改进,这次花了23秒:
这里它的推理能力是惊人的,几乎复盘了案件的真相:
凶手是死者的伴侣,而且伪造了字条,
有点东西。
到最后o1完全复盘了案件的经过:
甚至还有更精彩的版本:
推理小说以后是不是可以靠o1写了?
大家赶紧去体验一波!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-11-05
TinyAI :全栈式轻量级 AI 框架
2025-11-04
百灵大模型 Ling 和 Ring 系列首发支持 SGLang-JAX 推理引擎
2025-11-04
首个国产开源AI原生后端,不再写后端,AI就是全栈工程师。
2025-11-04
DeepCode: 用多智能体架构重新定义代码生成
2025-11-04
AI Infra:POINTS-Reader,腾讯开源的文档解析和OCR工具
2025-11-03
震惊,Github开源,真正让程序员效率提升 90%的AI辅助工具来啦!!!
2025-11-03
Dify迎来最强开源对手!这个本地Agent内置微调+超细权限控制~
2025-11-03
我们大胆做了个决定,大会所有音乐bgm由AI生成,这部分预算可以省了!|Jinqiu Scan
2025-08-20
2025-09-07
2025-08-20
2025-08-26
2025-08-22
2025-09-06
2025-10-20
2025-08-22
2025-09-08
2025-08-12
2025-11-03
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17
2025-09-09
2025-09-08