忽视小模型和知识库，企业AI应用必将是死路一条

发布日期：2025-05-07 08:17:38 浏览次数： 11314

作者：人生定数

微信搜一搜，关注“人生定数”

2022年，ChatGPT的出现让很多人惊呼“通用人工智能时代来了”！如今一转眼三年过去了，人工智能的热潮还在，但是在实际的生产生活中，人工智能的应用到底发展得怎么样了呢？是真的已经迈入了通用人工智能时代，还是说浮华之下仍是一地鸡毛呢？个人认为，大模型和通用人工智能的普及确实开始改变人们一部分的行为方式，但是远未达到真正意义上“智能”的门槛，甚至是不是代表了人工智能未来发展的正确路径都比三年前更值得怀疑。

一、大模型的出现确实为通用人工智能应用打开了一扇新的大门

大模型的本质是包含超大规模参数（通常在十亿个以上）和复杂计算结构的神经网络模型，它通过使用海量数据训练而成，基于其巨大的数据和参数规模，展现出类似人类的智能。通用大模型的训练基于互联网或者公开渠道可以获取的海量资料数据，所以它对于人类目前已掌握的常识性知识了解比较全面，再加上在文字组织方面采用思维链等新型推理方式，使得其在与人的对话中表现得“既博学、又自然”。

通用大模型的这些长处毫无疑问为人们的工作带来了一些方便。比如，有什么不了解的常识，可以直接去问大模型，由大模型给你找到答案，现在就连我才上四年级的儿子也知道有什么不了解的事情可以问问DeepSeek。再比如，本人也会在写投标文件的时候，针对一些没有资料参考的章节，让大模型给我一份底稿，然后我再修改和补充，效率确实提升不少。因此，我觉得大模型的出现，确实可以说是给通用人工智能应用到每个人打开了一扇全新的大门，也让每个人都能享受到人工智能技术带来的实惠。

但是，我们也要注意到，目前大模型和通用人工智能应用比较好的领域，主要集中在知识问答、资料搜索、文本图片视频生成等等，这些场景都有一个特点，就是大模型不用对结果负责，对或错不会影响到实际生产生活。因此，大模型还是主要做一些辅助，还远远无法为自己的行为负责，还是离不开人。此外，大模型经常也会出现“胡说八道”的情况，而且看起来还是一本正经的。它会把康熙干的事情嫁接给秦始皇，也会胡乱引用论文里的公式来解释今天为什么这么热。这些行为会误导人们，尤其是教错小孩，所以还是要慎之又慎。

二、通用人工智能和大模型难以应用到企业核心生产和管理中

对于一个企业来说，核心的生产和管理工作是非常严谨的，很多都是流程化的、标准化的。也就意味着，在实际的企业生产过程中，能够出错的冗余量极小，有的甚至不能有丝毫差错。在这样的要求下，大模型和通用人工智能的短处就会被无限放大，甚至成为一个令人不安的“定时炸弹”。

一方面，大模型的幻觉问题始终无法有效解决。这就意味着，同样一件事情，交给大模型来执行的时候，每次的结果有可能会存在很大的差异。这种差异的存在对于企业生产来说是致命的。试想你现在要给公司一把手汇报上半年的经营指标情况，结果大模型给你的结果每次都不一样，你怎么给领导汇报呢？

另一方面，大模型给出的很多结果是无法解释。这就意味着，即使你知道他的结果有问题，你都不知道错在哪里，应该怎么修正。还是经营指标的例子，每次结果不一样，你又不知道他每次是怎么算出来的，你就不知道哪个是对的，哪个是错的，应该怎么改。到头来还不如自己统计一边来的安心。

此外，还有一个最致命的问题，那就是不懂专业。大模型和通用人工智能是“通才”但不是“专才”，你问他常识，他比你懂得多，但是你问他企业里面的制度规范、专业知识、流程参数这些，它统统没有认知，因为没有人教它。在这种情况下，它就会“乱做”，成为一个不受控制的“不稳定因素”。

所以，在当前条件下，要想直接把大模型和通用人工智能应用到企业生产管理活动中，起到核心执行的作用，无异乎“天方夜谭”。因此，可能远不像很多企业领导所认为的，我引入了大模型服务、本地化部署的大模型、接入了DeepSeek，我们企业的生产管理就都可以智能化升级了，就可以解决大量人力成本了。

三、“又精又专”的小模型才是未来提升企业生产力的关键

那么，企业确实想要利用人工智能技术来提高生产力和生产效率的话，应在怎么做呢？我认为，相较于大模型，具备更强“专业能力”和确定性的小模型才是未来企业智能化升级的关键。

小模型，顾名思义，就是参数相对于大模型来说规模更小的模型。大模型和小模型在应用方面最大的区别是大模型偏向于全能化、通用化，而小模型一般偏向于解决某一垂直领域中的某个具体问题。比如一个图像识别小模型专门训练用来识别车牌号，对车牌号可以有很好的识别精度。但是一个图像识别大模型不仅可以识别车牌号，还可以识别我们生活中见到的大部分图片，而且站在我们人类的视角来看，他似乎对图片中的内容有自己的理解，看起来拥有更高的智能化水平。相比大模型来说，小模型通常具有更少的参数，学习的特征和模式比较单一，训练起来对计算资源的要求也不高。

对于企业来说，可行的一种做法是，将企业内部生产管理的工作进行专业划分，针对每个专业的核心工作内容都构建一个小模型，并利用已有的业务数据进行训练，让这个小模型可以执行规范的工作流程和准确的业务判断。而大模型作为一种辅助，发挥自身的优势，在规范以外的推理、文本生成等方面提供支持。在这种架构下，企业生产力的关键在于哪些专业小模型是不是足够专业，而不是依赖于大模型算力、算法和知识面强不强大。

四、知识库和高质量数据集才是AI时代的核心竞争力

不管是大模型还是小模型，他们解决的主要是思考和执行的问题。以人做比，就好比两个人，一个更博学一个更专精，但是没有人教他们相关的知识就什么事都干不了。这个也是现在很多企业慢慢发现的问题，上了大模型和人工智能，但是除了问答之外，什么事情都干不了。这是因为相对于模型，真正能决定人工智能应用成效的是企业级知识库和高质量数据集。

个人认为，知识库和高质量数据集是广义统一的，都是能够教会大模型或小模型做事的知识。从狭义上来看，高质量数据集是知识库的基础，知识库里的知识应该是在高质量数据集基础上进一步提炼出来的，包括了业务对象、属性、关系、规则等一系列内容。

举个例子，通信公司的杆路巡检，要及时发现存在的风险隐患或已经发生的故障。这个场景下，我从以往的巡检照片里挑出了2000张高质量的图片，覆盖了各种主要的隐患和故障表现。然后我需要把这些隐患点和故障点标注出来，人工或自动化标注工具都可以。这2000张经过标注的高质量图片就形成了这个场景的高质量数据集。基于这个数据集，我们进一步提炼相关的知识，比如把隐患和故障进行分级、不同隐患和故障对应不同的处理流程、不同的告知层级等等，这些就形成了这个场景下的知识库。然后，那这些高质量数据集和知识库去训练小模型，使其能够在一张新照片中准确找出隐患和故障，甚至可以发起相应的工单流程，给出建议措施或者干脆在线操作。

从上面的例子可以看出，在一个具体的业务场景里，真正发挥核心价值的是高质量数据集和知识库。而不管是高质量数据集还是知识库，绝大部分都是需要企业自己来构建的，这个是别人帮不了的。

五、短期内人工智能应用可能会需要投入更大的资源成本

既然是别人帮不了的，那么企业要做就需要自己投入资源和成本去做。

这是个非常矛盾的事情。绝大部分企业的老板想要引入人工智能，想的都是可以替代多少多少人力，可以节约多少多少成本，这样就可以多出多少多少利润。我只能说，如果能够实现最终的理想状态，确实是可以。但是，通往理想状态的道路并不好走。构建企业自己的高质量数据集、知识库还有训练专业小模型，都是需要初期大量投入、中期反复验证、后续持续维护的。这就意味着，在人工智能在实际工作方面真正发挥作用之前，就会有大量的沉默成本需要投入，这个投入可能在一定时间周期内（如三年、五年）并不会比沿用传统人力的成本低。也就是说，企业老板在人工智能方面的投资回报可能要在三五年后才能见到。包含央国企在内，又有多少企业能够接受这样的回报周期？

所以，当前很多企业所谓的人工智能应用，其实主要还是集中在一些知识问答、数据统计、辅助报告等比较通用的领域。这也是我在一开头就说当前的人工智能应用连“门槛”还远未达到的原因。

六、不能“持续培养”的小模型一样会成为“人工智障”

最后，还想说的一个点是，不管是大模型、小模型还是高质量数据集、知识库，都是需要“持续培养”的。对于高质量数据集和知识库来说，就是要定期更新或者补充内容，尤其是业务发生变化之后，要把带有新特征的数据和知识也纳入进来，保证数据和知识的全面性；对于大模型和小模型来说，需要那新的数据和知识来训练，也需要结合在实用中出现的问题进行快速的调整和优化。如果不能与时俱进，哪怕是小模型，一样也会成为“人工智障”，无法帮你解决问题的同时还会不断制造问题。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业