2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

DeepSeek开源推理模型 R1,比肩OpenAI o1正式版。

发布日期:2025-01-21 12:45:05 浏览次数: 7062
作者:Founder Park

微信搜一搜,关注“Founder Park”

推荐语

国产大模型 DeepSeek-R1 比肩 OpenAI o1 正式版,免费开源,这是我看到的最好消息,没有之一。

核心内容:
1. DeepSeek-R1 正式版发布及开源情况
2. 英伟达科学家的解读
3. DeepSeek-R1 展现的实力及开放使用方式

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

对标 OpenAI o1 正式版的国产大模型来了!
1 月 20 日晚,DeepSeek(深度求索)公司发布推理模型 DeepSeek-R1 正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
网友热评:这,才是真正的OpenAI。能力相当于一个月 200 美元的 ChatGPT o1 版本,却完全免费。
不止如此,DeepSeek 一同开源的还有「技术报告」,那些训练 R1 时踩过的坑、做过的事通通讲给你听,只为铺平 AGI 的路。
第一时间阅读这份技术报告后,英伟达高级研究科学家 Jim Fan 带来了新鲜解读,值得我们大声齐读:
「我们生活在这样一个时代:由非美国公司保持 OpenAI 最初的使命——做真正开放的前沿研究、为所有人赋能。这似乎讲不通,但戏剧性的往往最有可能发生。
DeepSeek-R1 不仅开源了大量模型,还泄露了所有训练秘密。他们可能是第一个显示 RL(强化学习)飞轮发挥主要作用、持续增长的 OSS 项目。
影响可以通过『内部实现了 ASI』或『草莓计划』等神话名称来实现。也可以通过简单地转储原始算法和 matplotlib 学习曲线来产生影响。」
中国公司 DeepSeek,正在实现赶超 OpenAI 的使命。


01 

DeepSeek-R1:

实力派选择「秀肌肉」
「DeepSeek-R1」的发布,摆明了是:有实力所以明晃晃地秀肌肉!
这首先体现在它不整期货那一套,而是「发布即上线」,现在,你就可以在 DeepSeek 官网与 App 体验最新的推理模型 DeepSeek-R1,随便体验随便用,免费。
登录 DeepSeek 官网或官方 App,打开「深度思考」模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。|图片来源:DeepSeek
DeepSeek-R1 也同步上线了 API,对用户开放思维链输出,通过设置 model='deepseek-reasoner' 即可调用。
值得注意的是 DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。看下面这这图你会有更直接的体感,输出 API 价格只有 OpenAI o1 的 3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AI Infra 层面降本的技术能力。
图中深蓝色柱子代表 DeepSeek-R1,剩下的灰色、浅蓝、青浅灰分别是 OpenAI o1 不同版本的价格。|来源:DeepSeek
第三波「秀肌肉」体现在开源开放。DeepSeek-R1 开源模型权重几乎是选择了最开放的许可证和用户协议,开源 License 统一使用 MIT,产品协议明确可「模型蒸馏」,主打一个让大家多多来基于它做二次开发、集成。DeepSeek 甚至主动给大家示范引导将 R1 作为教师模型来蒸馏出一个更小但仍有实力的模型,「通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果」。
事实上,模型开源选择不同的 License 背后大有学问,这直接体现不同模型厂商的开放程度,更体现开源背后的目的和策略。比如像 Llama、Qwen、GPT-2 等模型就不止开放权重,还开放了模型训练的源代码,这可能是为了追求衍生模型的繁荣。而 DeepSeek-R1 选择只开放权重,但换成了标准化、宽松的 MIT License,更多还是为了让更多开发者能用起来,感受 DeepSeek-R1 的能力。
我们再来通过几大主流测试基准来感受一下 DeepSeek-R1 的实力。「性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。」
图片来源:DeepSeek
对于 DeepSeek-R1 带来的直观感受,硅基流动联合创始人杨攀表示,不止模型能力和性能出色,最近两个模型 (R1 和 V3) 在训练技术和模型底层架构上都做了领先全球的创新,而且其论文开放程度也震惊了业界。
在一并公开的模型技术报告中,DeepSeek 将「DeepSeek-R1」训练技术全部公开,「旨在促进技术社区的充分交流与创新协作」。
根据技术报告,硅基流动创始人&CEO 袁进辉称,DeepSeek-R1 是无人区的探索和发现。|来源:即刻
对于开源模型加技术报告,开源社联合创始人林旅强此前向极客公园表示,开源是最好的「秀技术肌肉」的方式,同时「有的开源模型只开源、不讲他是怎么做的,但是合乎大家期待的开源模型是要搭配技术报告,等于是发 paper 了。开源模型不够的,因为模型是黑盒子,技术报告会说明一些东西。DeepSeek 他们是很透明地把他的技术报告拿来公开,即使一定程度还是会捂着掖着,但是已经是开得比较有态度。今天全球范围的学术派还是会认为,你把一个东西做出来再以开源的方式,是有学术追求的。」
如果 DeepSeek 的目标是真正达到 AGI,就不断需要把踩过的坑、做过的事情开放出来,让大家少走一点弯路,开放才能让整个行业更快达到 AGI,他补充道。
最后,我们来随机看一些用户实测评价(截图来源:X.com):
Twitter 用户盛赞 R1 的实力|图片来源:X


02 

DeepSeek,

还有什么惊喜是我们不知道的?!

尽管昨晚 DeepSeek-R1 的发布引发了「这才是 Open AI 吧」「东方的 OpenAI」等一片称赞。但 DeepSeek 强得非常扎实、全面。
去年在 2024 年 11 月 20 日发布 DeepSeek-R1-Lite 预览版时,美国著名半导体与 AI 咨询机构 Semianalysis 创始人 Dylan Patel 就坐不住了,第一时间下场「提醒」大家:他们有 5 万张 H100 GPU!请不要以为他们只有 1 万张 A100!
因为众所周知的原因,这大概率不是事实,却能反映 DeepSeek-R1-Lite 的强悍到让行业紧张。
一个月后,DeepSeek 上线并同步开源了媲美 GPT-4o 和 Claude 3.5 Sonnet 的模型「DeepSeek-V3」,并附上了详实的技术报告。这一次,几乎惊动了整个硅谷AI圈。卡神(OpenAI 创始团队、前 Tesla AI 总监 Andrej Karpathy)、Alexandr Wang(Scale.ai 创始人)、田渊栋(Meta AI 科学家)、贾扬清(Lepton AI 创始人)……人均一句「难以置信」。就连 Sam Altman 都忍不住出来酸一把「复刻已经被验证过奏效的东西是容易的」。
DeepSeek-V3 发布后,Sam Altman 疑似喊话 DeepSeek。|截图来源:X.com
随着模型性能逐渐走向全球第一梯队,DeepSeek 也迎来了新的发展契机。
过去一年半,DeepSeek 专注于模型和研究,但从今年开始,DeepSeek 着手做应用了。
2025 年 1 月 15 日,DeepSeek 推出移动端 AI 助手「DeepSeek」App。目前看,DeepSeek App 跟网页版功能一致,主要有两个功能:联网搜索和深度思考,主打一个简洁,聊天记录也会同步显示在手机端和网页端,尚未针对移动端进行特定功能的打磨,也没有市面上 AI 助手类 App 丰富、fancy 的功能,更像是一个能让你在手机上体验 DeepSeek 最新模型的入口。
DeepSeek App 展示图|来源:Apple Store
对此,一位投资人向极客公园解释 DeepSeek 开始做应用背后可能的战略转向:「前期 DeepSeek 靠自己的算力优势积累出了模型技术的领先度。后期要补数据,发 App 是补数据的手段之一。接入用户数据和场景,可以帮助他更好地进行模型能力的迭代和升级。」
同时,有了 DeepSeek-R1 和其他模态、类型越来越好的模型,可以期待未来 DeepSeek 在比如代码模型/应用里有更激进的表现,惊喜才刚刚开始。

官方放出的研究论文链接:

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf



更多阅读

45天100万美金ARR,这家创业公司找到了AI 3D生成的PMF
对话生数科技Vidu产品负责人:100天千万用户之后,2025年视频生成产品会变成怎样?
Gamma创始人自述:从0到4000万用户,我们是怎么做增长的?
Recraft专访:20人,8个月做出了最好的文生图大模型,目标是AI版的Photoshop
5亿估值、2500万用户,Suno CEO专访:Instagram拯救了摄影,我们想用AI拯救音乐

转载原创文章请添加微信:founderparker

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅