我要投稿

【AI知识】通用大模型与专用大模型

发布日期：2024-08-19 05:37:12 浏览次数： 3855

作者：A思维痕迹I

微信搜一搜，关注“A思维痕迹I”

我们是需要一个通才还是一个专才？在不同的场景有不同的答案，通才有更广的知识面和技能可以联通不同的领域，达到一种整合的效果，但是在某一个方面的深度会不如专才那么专业，而专才更适合在其擅长的领域内深耕。对比大模型的场景，我们需要一个通用大模型还是一个专用大模型呢？答案远没有前面一个问题的简单。有实验案例证明，如果只用专业领域的知识训练一个大模型，它的智能程度是远不及用通用数据训练出来的大模型的，泛化能力会大大受影响，这也是为什么一个预训练的基础模型很重要的原因。专业的模型需要基于一个预训练的通用模型去训练，才能达到更好的效果。

然而我们在实际的应用场景中，除了一些通用的技能，比如写通用知识文章，通用场景绘画等等，我们需要的更多的是针对特定的私有或专用领域的数据生成具有专业属性的知识内容或产品。

一个最简单的场景，就是我们在扣子或百度等智能体平台上创建的代理，比如漫画生成大师，SQL处理专家等，在任务技能上加上自己的一些要求或者数据的说明，实际上就是创建了一个专业领域的模型。

在创建专用领域的方法上，有几个不同的方法，上面就提到了两个，第一个是基于通用模型再训练出一个专用模型，第二个方法是用提示词的方法构建一个专用模型，除此之外第三个方法是例如SD那样，基于基础模型训练出一个小模型，然后大小模型结合的方式构建专用模型，也可以叫微调，第四个方法是用向量数据库的方式引入知识，基于数据库查询的方式，使大模型变成专用大模型。

不管基于哪一种方式，从实际应用中可以看出来，虽然通用大模型是一个必备的基底，在实际场景中我们需要做的是将它尽量塑造成某一个领域的角色，然后提供更为专一专业的知识。而目前研究者和应用者们，一方面是在努力提高大模型的性能，另一方面就是让大模型和实际的业务知识结合，成为领域专家。

当前几个创建专用模型的方式都存在各自的挑战，重训练虽然效果最好，但是面临的问题是成本，一旦中间环节有一点差错就需要推倒重来，成本高昂。微调是比较好的方式，但是相对于提示词和向量数据库的方式，依然具有成本问题，而且学习门槛和应用门槛较高，需要具有比较专业的知识和技能。提示词方法胜在成本低，相对来说效果不如前面的方法好，在内容的格式设计上也有一定的要求，向量数据库可以更好地组织内容，使大模型更好理解，但是对相似度高的信息存在定位不准确的问题，如何保护隐私数据也是一个备受关注的议题。

目前，都说AI陷入沉寂，都在等待一个杀手级的应用，你设想的杀手级应用又是怎样的呢？