2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

大模型大甩卖

发布日期:2024-05-31 06:10:10 浏览次数: 3435
作者:多面体InterfaceX

微信搜一搜,关注“多面体InterfaceX”

正在降价的大模型API无法催促超级应用的诞生。但在整个应用生态中,当大模型时代的“电价”足够普惠,垂直应用生态有望进一步繁荣。



记者 | 陈振芳 伍洋宇

编辑 | 文姝琪

头图©界面新闻 匡达



每当工作遇到困难的时候,梁文峰总会想起量化投资先驱西蒙斯的话:“一定有办法对价格建模。”梁文锋是私募基金幻方量化的实际控制人。由他创立的大模型公司DeepSeek在业内被称为“价格屠夫”,是最近这一轮大模型价格战的始作俑者。


2024年5月6日,DeepSeek发布DeepSeek-V2开源MoE模型,在市场毫无预见的情况下改变了大模型厂商格局。其API接口定价直接下探至每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo的近百分之一。


不出半个月,智谱AI、字节跳动、阿里云、百度、腾讯云接连选择跟进降价。其中,腾讯和百度直接免费了几款大模型产品——正如梁文峰曾经相信的那样,由他发起的价格战正在重塑整个大模型产业格局。


过去一年多的大模型狂热推动英伟达市值一路暴涨。然而,除了提供GPU的英伟达赚到了钱,大模型厂商依然在大量烧钱。每一次模型训练,用户的每一次询问,开发者的每一次调用,都对应一份算力消耗,每次消耗都是一笔成本账。


这使得突如其来的降价潮更加出乎旁观者意料。“去年跟LP汇报时,我们预测三年后才能达到现在的价格水平,没想到不到一年就达到了。”一位硬科技投资人告诉界面新闻,降价肯定会促使AI应用迸发,只是这一天更早的到来了。



01



引领这轮降价潮的梁文峰被认为是一个“搅局者”。


2008年,他从浙江大学毕业,并没有走入如火如荼的互联网创业。在外界无从得知的几年,传说他曾住在成都的出租屋,几经波折最终走上量化投资之路。多年后,由他主导建立的幻方量化成为突破千亿大关的量化私募机构。


投资和大模型有何关系?梁文峰就是两条路上交汇的那一个点。不少AGI信仰者声称:“Scaling law”(规模法则)是通往AGI的必经之路,即数据、算力、计算量越大,训练的模型越“聪明”。而量化投资者们相信大数定律,当样本容量足够大时,样本均值将趋近于总体均值。


“DeepSeek创始人是理想主义者。”有投资人向界面新闻如此评价。梁文峰的理想主义“财大气粗”,带着一万枚英伟达A100 GPU、在北京租赁近2000平方米场地,“深度求索DeepSeek”在2023年7月横空出世,寓意“路漫漫其修远兮,吾将上下而求索”。


万卡不一定是DeepSeek的上限。有行业人士向界面新闻表示,这家公司或许已经有超两万枚英伟达A100 GPU。除了互联网巨头,几乎没有创业公司有如此多算力储备。

制图:界面新闻何苗


在DeepSeek率先挑起价格战之后,“跟还是不跟?”成为行业里每个参与者必须面对的选择题。


最先坐不住的是掌握大量企业客户的智谱AI。这家公司率先将对标GPT3.5-Turb的入门级模型GLM-3 Turbo模型调用价格下调90%,由5元/百万tokens调整为1元/百万token。


随之而来的则是从未缺席过任何一场行业价格战的互联网大厂们。


字节跳动直接将大模型从以分计价带到以厘计价时代。旗下的豆包通用模型pro-32k版输入价格降至0.0008元/千Tokens,为同规格模型的1/150。


阿里云旗下的通义千问GPT-4级主力模型宣布降价97%,API输入价格从0.02元/千tokens降至0.0005元/千tokens,旗下9款商业化及开源模型也纷纷降价。


战况愈演愈烈。百度文心直接将ERNIE Speed、ERNIE Lite两款免费。腾讯云随后也宣布混元大模型全面降价,主力模型之一“混元-lite”从0.008元/千tokens调整为免费,API输入输出总长度也将从目前的4k升级到256k。


然而,降价接力赛在大厂之间如火如荼,但创业公司的身影却鲜少出现。大部分备受关注的独角兽们均不动声色。


百川智能创始人王小川认为,这一轮大厂降价的实质是云厂商进到新战场,降价是大厂射程范围内的事。他劝创业公司别把这个商业模式作为业务重点,也别掺和进去。


零一万物创始人李开复的表态更早,也更强硬。


在这轮降价潮袭来之前,李开复就提醒说,“不应在行业内按照ofo式的烧钱打法重蹈覆辙。”而在大厂降价的苗头渐起后,他依然表达了不参战的态度,“如果以后中国市场可能就是这么卷,大家宁可赔光通输也不让你赢,那我们就走外国市场。”


李开复坚持认为价格战是一个“双输”的打法,创业公司如果认定自己的技术值得,就应当坚持一个合适的价格,而绝不能靠贴钱、赔钱做生意。


图源:创新工场



02



大厂和创业公司面对降价潮态度不一的背后,是心态和资金储备的全然不同。


创业公司的视角是更好理解的。当前仍在牌桌上且手握大把筹码的大模型创业公司,大都认可研发和应用的“双轮驱动”理论,这意味着它们既要做模型,也要做产品。而模型要技术人才、万卡集群,产品要投流买量、跑马圈地,创业公司烧钱的日子还在后头。


更重要的是,创业公司的野望在C端(个人用户市场)而非B端(企业市场)。“没有一家大模型公司靠卖API活着。”一名关注大模型行业的FA(财务顾问)对界面新闻记者表示。


但如果选择不参战,创业公司也无法完全无动于衷,必须找到自己的应对策略。


猎豹移动董事长兼CEO傅盛认为,这次大降价基本宣告了大模型创业公司必须寻找新的商业模式。降的最凶的都是有云服务的大公司,通过大模型来获取云客户,“羊毛出在猪身上,降得起”,而大模型创业公司没有这样的生态,必须另寻商业模式。


除此以外,创业公司还需要警惕的是,自己是否会被可能出现的市场格局变动挤下牌桌。


活跃在投融资的FA和VC们告诉界面新闻,融到钱的创业公司其实已经到了向投资人和市场“秀肌肉”的时刻。但技术进展的漫漫征程摆在眼前,烧钱也烧不过大厂,当商业化进展不够顺利,估值处于第二、第三梯队的创业公司,会面临融资压力陡增的境地。


“今年很多大模型初创公司可能会出局,”前述FA表示,“市场上并不需要这么多家企业。”


而对资源储备雄厚的大厂而言,降价的决策其实“早有预谋”。


在这波密集动作之前,它们几乎已经都在通过代金券、场景合作、工程优化等各种方式,试图降低模型利用的成本,当前的定价也是结合技术和用户规模预期等综合因素考量的结果。


“坦白说,谁的算力更充沛,谁就会有更大的收益。”上述FA人士表示。一个可证实的数字是,据DeepSeek内部人士消息,该公司大模型服务在降价后的利润率仍超50%。


“关键是什么时候降价?”这可能是过去一年所有云厂商都在琢磨的问题,直到DeepSeek作为导火索出现。


从技术上来说,大模型价格战打得起来的根本原因在于,模型之间的差距不大。一位投资人直言,大厂之所以跟进,是因为在它们的视野中,DeepSeek所实现的架构创新自己可以在短期内达成,提前亏几个月无所谓。


一位前互联网云厂商从业人员告诉界面新闻,由于企业缩减预算,这两年云市场的行情并不太好。另一方面,大模型还是没有那么颠覆性,尤其国内大模型还远不如国外成熟。所以,以价格换市场成为自然而然的选择。


多名受访者认为,大厂降价的目的就是笼络更多企业和开发者,为自己搭建生态护城河。


一名火山引擎内部人士告诉界面新闻:“豆包大模型降价的真实原因在于,大模型在B端的应用还没有起来,场景太少。”他指出,虽然行业在讨论用AI大模型重构业务,但在日常工作生活里很少能感受到大模型能力的落地。“降价本质上是降低使用门槛。”


这个观点在跟进降价的大厂中间是共识。大模型仍然处于市场培育阶段,降价或免费都是为了让更多企业和开发者能快速用上,并接入到自己的业务场景中。毕竟,让更多人参与进来是行业发展的前提。

制图:界面新闻何苗



03



降价能不能最终带来AI生态的繁荣?


AI应用层的投资人对此持乐观态度。杨泉在去年大模型公司融资势头最为火爆的时候,见过月之暗面创始人杨植麟,也见过王小川,但他所在的机构最终没有买下那张通用大模型的入场门票,而是转向了AI应用层。


“我跟朱啸虎的观点比较一致,所以我是乐于见到所谓降价潮的。”杨泉说,只有基础设施的成本极低,在上面做应用的公司才能迎来爆发。


过去移动互联网的发展已经证明了这一点。当运营商的网络资费,云服务厂商的成本大幅下降之后,才逐渐长出了微信、抖音等等超级应用。


而大模型领域也许能复制这一过程。当前在基础大模型领域,中国公司的能力与OpenAI等美国引领者还有较大差距。多位投资人表示,中国弯道超车的机会在大模型应用层。


一位美元基金硬科技投资人对中国的大模型发展更加乐观:“中国不擅长于做颠覆性的创新,但特别适合做增量式创新,或者叫‘快速跟随者’。”


他进一步指出,短期内,大模型领域的创新层出不穷,中美存在较大差距。但把时间拉轴拉长来看,创新斜率总会慢慢变平,当曲线变平,中国就会有机会去反超,这是在电动车领域已经发生的故事,“当特斯拉的技术创新放缓,中国电动车就追上来了。”


李飞飞团队也提到,中国在全球AI专利申请方面占据主导地位,美国在AI模型的发展上保持领先。今年上半年,中国大模型创业公司和互联网大厂对于模型更新和产品发布的节奏,在战术上已有对于OpenAI的全面追赶之势。


不过也有人持不同意见,作为一家大模型应用初创公司的创始人,李灵昊没有被这轮降价潮打动。在他的观察中,更大参数、更大模型能力的高参量模型并没降价或者降幅不多,主要是放开了一些低端的使用场景。


因此,从技术角度来说,他认为这轮降价并没有为下游带来太多变化。相较而言,他们更期待的是真正的技术变革。


李灵昊认为,但如果行业志在看到颠覆性的创新繁荣,大模型厂商们的最好做法,仍然是推进Scaling Law,真正从性能上让下游开发者感受到何为如虎添翼。


大厂对此不是没有认知。百度内部人士告诉界面新闻:“长期来看,模型厂商最终竞争的还是模型本身的能力,只有把基础模型效果做得足够好,才能构筑竞争壁垒。”


前述关注大模型行业的FA也指出,API价格战不能代表什么,因为价格本身已经足够低了,它更多来源于技术架构更新叠加市场剧烈竞争,“大家只是被迫卷,想先拉出身位差 。”


不过,正如投资人所预言的那样,降价难以影响模型性能升级,但有机会促使AI应用的大迸发。


尽管王小川定义下的“超级应用”只与“超级模型”深度绑定,正在降价的大模型API无法催促超级应用的诞生。但在整个应用生态中,当大模型时代的“电价”足够普惠,垂直应用生态有望进一步繁荣。


回看当下,降价潮并不会偃旗息鼓。前述FA判断,“价格战仍未触底,硅基流动所引领的AI infra(AI 基础软件)还能将大模型的性能和价格再次‘击穿’,只是还没有对外发布。”——从这个角度而言,AI 2.0时代的“电力普及”或许才刚刚开始。


发起这场价格战的DeepSeek已经开始悄悄谋划从幻方量化独立出来,酝酿成为大模型赛场的大玩家。理论上,梁文峰彼时会手握量化交易、大模型两张王牌。交易出身的他,曾无数次证明过一个普通道理,即价格可以重构市场。



(应受访者要求,李灵昊、杨泉为化名)


(界面新闻记者肖芳、崔鹏对此文亦有贡献)


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅