2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

忽视小模型和知识库,企业AI应用必将是死路一条

发布日期:2025-05-07 08:17:38 浏览次数: 11314
作者:人生定数

微信搜一搜,关注“人生定数”

推荐语

企业AI应用的未来,不能没有小模型和知识库的支持。

核心内容:
1. 大模型和通用AI在实际应用中的局限性
2. 大模型在知识问答等领域的优势与不足
3. 企业核心生产管理中对AI应用的严格要求及挑战

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

2022年,ChatGPT的出现让很多人惊呼“通用人工智能时代来了”!如今一转眼三年过去了,人工智能的热潮还在,但是在实际的生产生活中,人工智能的应用到底发展得怎么样了呢?是真的已经迈入了通用人工智能时代,还是说浮华之下仍是一地鸡毛呢?个人认为,大模型和通用人工智能的普及确实开始改变人们一部分的行为方式,但是远未达到真正意义上“智能”的门槛,甚至是不是代表了人工智能未来发展的正确路径都比三年前更值得怀疑。


一、大模型的出现确实为通用人工智能应用打开了一扇新的大门


大模型的本质是包含超大规模参数(通常在十亿个以上)和复杂计算结构的神经网络模型,它通过使用海量数据训练而成,基于其巨大的数据和参数规模,展现出类似人类的智能。通用大模型的训练基于互联网或者公开渠道可以获取的海量资料数据,所以它对于人类目前已掌握的常识性知识了解比较全面,再加上在文字组织方面采用思维链等新型推理方式,使得其在与人的对话中表现得“既博学、又自然”。


通用大模型的这些长处毫无疑问为人们的工作带来了一些方便。比如,有什么不了解的常识,可以直接去问大模型,由大模型给你找到答案,现在就连我才上四年级的儿子也知道有什么不了解的事情可以问问DeepSeek。再比如,本人也会在写投标文件的时候,针对一些没有资料参考的章节,让大模型给我一份底稿,然后我再修改和补充,效率确实提升不少。因此,我觉得大模型的出现,确实可以说是给通用人工智能应用到每个人打开了一扇全新的大门,也让每个人都能享受到人工智能技术带来的实惠。


但是,我们也要注意到,目前大模型和通用人工智能应用比较好的领域,主要集中在知识问答、资料搜索、文本图片视频生成等等,这些场景都有一个特点,就是大模型不用对结果负责,对或错不会影响到实际生产生活。因此,大模型还是主要做一些辅助,还远远无法为自己的行为负责,还是离不开人。此外,大模型经常也会出现“胡说八道”的情况,而且看起来还是一本正经的。它会把康熙干的事情嫁接给秦始皇,也会胡乱引用论文里的公式来解释今天为什么这么热。这些行为会误导人们,尤其是教错小孩,所以还是要慎之又慎。


二、通用人工智能和大模型难以应用到企业核心生产和管理中


对于一个企业来说,核心的生产和管理工作是非常严谨的,很多都是流程化的、标准化的。也就意味着,在实际的企业生产过程中,能够出错的冗余量极小,有的甚至不能有丝毫差错。在这样的要求下,大模型和通用人工智能的短处就会被无限放大,甚至成为一个令人不安的“定时炸弹”。


一方面,大模型的幻觉问题始终无法有效解决。这就意味着,同样一件事情,交给大模型来执行的时候,每次的结果有可能会存在很大的差异。这种差异的存在对于企业生产来说是致命的。试想你现在要给公司一把手汇报上半年的经营指标情况,结果大模型给你的结果每次都不一样,你怎么给领导汇报呢?


另一方面,大模型给出的很多结果是无法解释。这就意味着,即使你知道他的结果有问题,你都不知道错在哪里,应该怎么修正。还是经营指标的例子,每次结果不一样,你又不知道他每次是怎么算出来的,你就不知道哪个是对的,哪个是错的,应该怎么改。到头来还不如自己统计一边来的安心。


此外,还有一个最致命的问题,那就是不懂专业。大模型和通用人工智能是“通才”但不是“专才”,你问他常识,他比你懂得多,但是你问他企业里面的制度规范、专业知识、流程参数这些,它统统没有认知,因为没有人教它。在这种情况下,它就会“乱做”,成为一个不受控制的“不稳定因素”。


所以,在当前条件下,要想直接把大模型和通用人工智能应用到企业生产管理活动中,起到核心执行的作用,无异乎“天方夜谭”。因此,可能远不像很多企业领导所认为的,我引入了大模型服务、本地化部署的大模型、接入了DeepSeek,我们企业的生产管理就都可以智能化升级了,就可以解决大量人力成本了。


三、“又精又专”的小模型才是未来提升企业生产力的关键


那么,企业确实想要利用人工智能技术来提高生产力和生产效率的话,应在怎么做呢?我认为,相较于大模型,具备更强“专业能力”和确定性的小模型才是未来企业智能化升级的关键。


小模型,顾名思义,就是参数相对于大模型来说规模更小的模型。大模型和小模型在应用方面最大的区别是大模型偏向于全能化、通用化,而小模型一般偏向于解决某一垂直领域中的某个具体问题。比如一个图像识别小模型专门训练用来识别车牌号,对车牌号可以有很好的识别精度。但是一个图像识别大模型不仅可以识别车牌号,还可以识别我们生活中见到的大部分图片,而且站在我们人类的视角来看,他似乎对图片中的内容有自己的理解,看起来拥有更高的智能化水平。相比大模型来说,小模型通常具有更少的参数,学习的特征和模式比较单一,训练起来对计算资源的要求也不高。


对于企业来说,可行的一种做法是,将企业内部生产管理的工作进行专业划分,针对每个专业的核心工作内容都构建一个小模型,并利用已有的业务数据进行训练,让这个小模型可以执行规范的工作流程和准确的业务判断。而大模型作为一种辅助,发挥自身的优势,在规范以外的推理、文本生成等方面提供支持。在这种架构下,企业生产力的关键在于哪些专业小模型是不是足够专业,而不是依赖于大模型算力、算法和知识面强不强大。


四、知识库和高质量数据集才是AI时代的核心竞争力


不管是大模型还是小模型,他们解决的主要是思考和执行的问题。以人做比,就好比两个人,一个更博学一个更专精,但是没有人教他们相关的知识就什么事都干不了。这个也是现在很多企业慢慢发现的问题,上了大模型和人工智能,但是除了问答之外,什么事情都干不了。这是因为相对于模型,真正能决定人工智能应用成效的是企业级知识库和高质量数据集。


个人认为,知识库和高质量数据集是广义统一的,都是能够教会大模型或小模型做事的知识。从狭义上来看,高质量数据集是知识库的基础,知识库里的知识应该是在高质量数据集基础上进一步提炼出来的,包括了业务对象、属性、关系、规则等一系列内容。


举个例子,通信公司的杆路巡检,要及时发现存在的风险隐患或已经发生的故障。这个场景下,我从以往的巡检照片里挑出了2000张高质量的图片,覆盖了各种主要的隐患和故障表现。然后我需要把这些隐患点和故障点标注出来,人工或自动化标注工具都可以。这2000张经过标注的高质量图片就形成了这个场景的高质量数据集。基于这个数据集,我们进一步提炼相关的知识,比如把隐患和故障进行分级、不同隐患和故障对应不同的处理流程、不同的告知层级等等,这些就形成了这个场景下的知识库。然后,那这些高质量数据集和知识库去训练小模型,使其能够在一张新照片中准确找出隐患和故障,甚至可以发起相应的工单流程,给出建议措施或者干脆在线操作。


从上面的例子可以看出,在一个具体的业务场景里,真正发挥核心价值的是高质量数据集和知识库。而不管是高质量数据集还是知识库,绝大部分都是需要企业自己来构建的,这个是别人帮不了的。


五、短期内人工智能应用可能会需要投入更大的资源成本


既然是别人帮不了的,那么企业要做就需要自己投入资源和成本去做。


这是个非常矛盾的事情。绝大部分企业的老板想要引入人工智能,想的都是可以替代多少多少人力,可以节约多少多少成本,这样就可以多出多少多少利润。我只能说,如果能够实现最终的理想状态,确实是可以。但是,通往理想状态的道路并不好走。构建企业自己的高质量数据集、知识库还有训练专业小模型,都是需要初期大量投入、中期反复验证、后续持续维护的。这就意味着,在人工智能在实际工作方面真正发挥作用之前,就会有大量的沉默成本需要投入,这个投入可能在一定时间周期内(如三年、五年)并不会比沿用传统人力的成本低。也就是说,企业老板在人工智能方面的投资回报可能要在三五年后才能见到。包含央国企在内,又有多少企业能够接受这样的回报周期?


所以,当前很多企业所谓的人工智能应用,其实主要还是集中在一些知识问答、数据统计、辅助报告等比较通用的领域。这也是我在一开头就说当前的人工智能应用连“门槛”还远未达到的原因。


六、不能“持续培养”的小模型一样会成为“人工智障”


最后,还想说的一个点是,不管是大模型、小模型还是高质量数据集、知识库,都是需要“持续培养”的。对于高质量数据集和知识库来说,就是要定期更新或者补充内容,尤其是业务发生变化之后,要把带有新特征的数据和知识也纳入进来,保证数据和知识的全面性;对于大模型和小模型来说,需要那新的数据和知识来训练,也需要结合在实用中出现的问题进行快速的调整和优化。如果不能与时俱进,哪怕是小模型,一样也会成为“人工智障”,无法帮你解决问题的同时还会不断制造问题。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅