2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

垂直领域大模型微调的实战经验大揭秘

发布日期:2024-08-21 08:59:02 浏览次数: 3644
作者:数据AI指北

微信搜一搜,关注“数据AI指北”

这段时间,一直在思考微调垂直大模型。涉及的领域:大数据和大模型。

由于配置和经费问题,想着用一个小模型去微信一个大数据专家。

基于Qwen2-0.5B模型进行垂直微调,利用【数据中台-让数据用起来(第2版)】PDF书籍制造问答数据。

初期效果不是很好,特别是模型合成的时候,更不好了。

继续ing

在查阅知乎的时候,看到一篇微调模型总结,分享给小伙伴...

垂直领域大模型微调的实战经验,从基座模型选择、模型整体架构、数据设计和训练微调四个方面进行详细解析。结合实际案例和测试结果,文章提供了具体可行的操作方法和注意事项,适用于各类垂直领域大模型的微调实践。

一、基座模型选择

在选择基座模型时,最好选择那些已经在相关领域有一定基础的模型。

比如在医学领域,BLOOMZ模型是个不错的选择,因为它使用了PILE语料库进行训练,包含了大量医学文本,如PubMed Central和PubMed Abstracts。这类模型的医学知识体系相对比较完善,能够在微调时更好地适应医学领域的需求。

选择基座模型时,还要考虑模型的参数规模和性能。超大参数模型(至少百亿)的能力即使经过量化,仍能保持较高的性能。这类模型虽然训练和部署成本较高,但在处理复杂任务时表现更佳

另外,不要指望一个单个垂直领域的LLM就可以满足所有需求。

合理的做法可能是结合实时更新的知识库和微调的垂直领域LLM,比如ChatLaw。这种组合能够更好地应对多变的需求,同时保持模型的灵活性和实用性。(合理,微调+知识库RAG的方式相结合)

二、模型整体架构

在设计模型整体架构时,要注意灵活性和可扩展性。一个合理的模型架构不仅要能够满足当前的需求,还要具备一定的扩展能力,以应对未来可能出现的变化和增加的需求。

比如,对于医学领域的大模型,可以采用一个实时更新的知识库加上一个微调后的医学LLM的架构。这种架构不仅可以保证模型的实时性,还能通过知识库的更新来弥补模型在某些特定知识点上的不足。

超大参数模型的设计也是一个需要重点考虑的方面。虽然这些模型的训练成本较高,但其在处理复杂任务时的表现往往优于小参数模型。因此,在资源允许的情况下,优先选择超大参数模型进行微调。

三、数据设计

数据设计是微调过程中至关重要的一环。在LLM时代,数据质量往往比数据数量更为重要。比如,上交清源和里海的研究表明,利用200条高质量数据微调模型,其效果可能超过使用大量低质量数据。

为了防止灾难性遗忘,在算力充足的情况下,建议使用垂直领域数据和通用语料数据进行混合训练。这样既可以保证模型在垂直领域的表现,也能保持其通用能力。

在进行大规模数据的二次预训练时,需要添加5-10倍原始预训练中的其他类型数据,并打混后一起训练。大量增加某类在预训练时没有的知识,可能会造成模型参数的大幅度变化,从而影响模型整体性能。

噪音数据的控制也是数据设计中的一个关键点。预训练数据中如果出现少量连续的噪音数据,比如重复单词或非单词序列,都会影响模型的表现。因此,在数据准备过程中,必须严格控制数据的质量,确保训练数据的干净和高质量。

四、训练微调

训练微调是模型性能优化的最后一步,也是最为关键的一步。在全流程的LLM训练中,包括了预训练、监督微调、奖励模型和强化学习等多个环节。对于大多数垂直领域模型来说,监督微调已经能够满足大部分需求。

在指令微调阶段,不建议进行过多轮次的训练。针对少量数据进行多个epoch的训练,可能会导致模型的关键区域发生变化,从而影响整体性能。为了保证模型语言能力关键区不被大幅度调整,需要在指令微调过程中添加通用指令数据或者预训练数据。

模型微调时,优化器的选择对结果影响并不大。无论是AdamW、带调度器的SGD,还是带调度器的AdamW,对结果的影响都微乎其微。但是,调整LoRA rank和选择合适的α值至关重要,可以把α值设置成rank值的两倍

虽然LLM训练有着不可避免的随机性,但多轮训练的结果仍非常一致。因此,在条件允许的情况下,可以通过多轮训练来进一步优化模型性能。如果受GPU内存限制,QLoRA提供了一种高性价比的折衷方案,以运行时间增长39%的代价,节省33%的内存。

总的来说,垂直领域大模型的微调需要结合实际需求,选择合适的基座模型,设计合理的模型架构,处理和设计高质量的数据,并在训练和微调过程中严格控制各个细节。通过这些方法和技巧,可以显著提升大模型在垂直领域的表现。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅