2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

企业生成式人工智能应用的架构模式:GraphRAG、RAG、DSFT和RAFT

发布日期:2024-09-12 14:38:28 浏览次数: 2642
作者:知识图谱科技

微信搜一搜,关注“知识图谱科技”


前段时间发了一篇文章,GenAI大模型应用方法选择深度解析: 模型训练,微调,检索增强RAG和提示工程,介绍了生成式人工智能在企业应用的几种模式。在最近的一些报告中,也总结了基于成本资源分析的不同应用模式。

最近技术发展较快,有更多的模式出现,尤其是微软开源了GraphRAG重磅 - 微软官宣正式在GitHub开源GraphRAG。如何探索可用于构建GenAI解决方案的建筑模式以及选择适合特定用例的正确框架的企业级策略也变得更加复杂。

最佳设计的企业架构是任何组织IT系统的支柱,它支持实现组织商业目标的基础构建模块。该架构由最佳实践、明确的策略、通用框架以及工程团队和其他利益相关者选择正确工具以完成任务的指南组成。企业架构主要由支持业务线的架构团队管理。在大多数组织中,架构团队负责描述架构模式和通用框架,以帮助工程和产品团队不必花费数小时进行概念验证,而是帮助他们采用基于模式设计核心构建模块的策略。  

随着生成AI正在改造整个领域,大多数组织要么在构建基于生成AI的应用程序,要么在将生成AI能力或特性集成到现有应用程序或产品中。在本文中,我们将深入探讨构建生成AI解决方案的常见架构模式。我们还将讨论在正确的用例中选择正确框架的各种企业级策略。

模式一:领域特定微调(DSFT)

大型语言模型(LLM)在企业生成AI的架构中扮演着重要的基础角色。LLM负责基于其接受的训练和所掌握的知识生成独特的内容。然而,来自OpenAI、微软或开源社区的LLM缺乏企业数据的知识。在组织中,有时会有自己的标准和原则,这些也应该在生成内容时遵循。

为了解决这一领域的用例,微调是我们可以利用的策略之一。微调涉及在一个较小的、经过专门策划的数据集上进一步训练预训练的LLM,该数据集旨在包含企业独特的数据、标准和原则。这个过程有助于使模型的输出更紧密地符合组织的要求,从而增强其在企业环境中的适用性和有效性。

什么是领域特定微调?  

正如之前所述,微调大型语言模型(LLM)涉及调整预训练语言模型,以更好地执行特定任务或领域。这是通过进一步使用由输入和输出对组成的小型专业数据集对模型进行训练来实现的。这些对是显示所需行为或输出的示例。

在微调过程中,模型的参数会被更新,这有助于弥合预训练模型的通用能力与任务的具体需求之间的差距。这个过程提高了模型的性能,使其在给定任务上更准确,符合人类的期望。

DSFT模式可以成为最佳候选的用例  

微调非常适合组织希望获取更专业和领域特定内容生成的领域。如果用例要求在生成内容时遵循特定的标准和风格,那么“微调”就是一个很好的工具。

例如,假设客户服务部门想要开发一个自动化工作流程解决方案,以替代手动过程。在手动过程中,现场客户服务代理会回应客户或潜在客户有关其产品或服务的查询。目前,现场客户服务代理会对客户或潜在客户有关产品或服务的咨询做出回应。代理需要理解客户电子邮件的意图和含义,进行一些研究,然后在回应时遵循公司的指导方针。这个过程通常需要代理2到3个小时,而组织收到大量客户电子邮件询问他们的产品。

通过使用微调,组织可以训练一个AI模型,自动理解和响应这些询问,并遵循公司的标准和指导方针。这可以节省大量时间,并确保响应的一致性和准确性。

微调通常分为以下几类:  

  • 监督微调(SFT)  

  • 基于人类反馈的强化学习(RLHF)  

  • 参数高效微调(PEFT)  

    • 低秩适应(LoRA)  

    • 量化低秩适应(QLoRA)  


企业策略以微调模式  

如果我们计划使用此模式构建下一个生成性人工智能应用,那么唯一的缺陷是此模式既耗时又昂贵,尽管它几乎能产生完美且高质量的输出。它之所以耗时,是因为需要使用上述任何方法对大型语言模型进行重新训练,这需要准备数据集、训练语料和人工标注者。如果组织的数据是动态的,且频繁更新,那么不建议使用此模式,因为每次数据更改时,LLM 都需要经过重新训练,这将变得非常昂贵。如果数据的动态性不强,并且我们希望 LLM 产生高质量的特定领域输出,那么微调是最佳方法。

模式2:RAG(检索增强生成)  

RAG或检索增强生成是几乎所有企业生成AI开发中使用的一种流行模式,因为这是最具成本效益的模式之一,可以显著节省构建生成AI应用程序的开发工作。RAG的基本结构可以概括如下:  

R - (R)基于相似性搜索算法检索上下文。  

A - (A)增强检索到的上下文以及对大型语言模型的生成指令(提示工程)。  

G - 大型语言模型将根据上下文和指令(提示工程)生成内容,并将生成的响应发送给用户。  

在RAG模式中,我们集成了一个矢量数据库,可以存储和索引嵌入(数字内容的数值表示)。我们使用各种搜索算法,例如HNSW或IVF,来检索前k个结果,然后将其用作输入上下文。搜索是通过将用户的查询转换为嵌入进行的。前k个结果被添加到一个精心构造的提示中,指导大型语言模型生成内容以及应遵循的步骤,还包括应考虑的上下文或数据。  

一旦大型语言模型根据提示和输入上下文生成内容,它会通过一个脏话检查(可选)或审查层。经过验证的响应随后以人类可理解的格式呈现给用户。  

Retrieval-Augmented Generation for Large Language Models: A Survey (arxiv.org)

https://arxiv.org/html/2312.10997v5

RAG模式可以作为最佳候选者的用例  

当我们需要大型语言模型基于特定组织的数据生成内容时,RAG是一种易于构建且具有成本效益的解决方案。由于大型语言模型没有经过组织私有数据的训练,而训练需要大量时间,我们利用RAG模式构建生成AI应用程序。  

基于AI的智能企业搜索、虚拟助手或聊天机器人帮助客户理解复杂文档、HR聊天机器人、推荐引擎,以及需要快速了解程序以更好地帮助客户的客户服务代理是RAG的完美用例。  

一些流行的企业级用例包括:  

  • 通过员工培训和入职支持的HR支持:RAG模式可以用来构建HR支持应用程序,提供定制化的培训材料并回答具体问题,以促进顺利的入职过程,从而腾出时间让HR专注于其他领域。  

  • 医疗行业:基于RAG的生成AI应用程序可以为医疗专业人士提供有关各种治疗方案和医学研究的信息,以改善患者护理。  

  • 企业知识挖掘和管理系统:RAG可用于构建帮助员工从庞大的内部内容库中查找和检索相关组织特定信息的产品。  

  • 销售和营销应用:使用RAG,轻松构建个性化产品推荐,并为营销活动或与产品相关的数据生成内容。  

  • 技术支持应用:基于生成AI的应用可以总结故障排除步骤和相关技术文档,以帮助客户服务代理更快地解决问题。  


针对企业策略的RAG  

当数据源具有动态特性(意味着我们预计数据会频繁更新)时,RAG(检索增强生成)是一个理想的解决方案。RAG在数据定期变化的环境中表现更好,因为它允许实时更新,并确保检索到的信息始终与变化保持同步。使用RAG,每次数据源更新时,向量数据库中的嵌入也必须在数据摄取期间更新,以准确反映这些变化。  

大多数企业RAG应用程序在其架构中具有以下两个主要工作流程:  

1. 数据处理与摄取 

此工作流程涉及将源数据提取、转换和加载(ETL)到向量数据库中,形式为嵌入。当新增数据或现有数据被修改时,系统会处理这些更改,生成新的嵌入,并更新向量数据库。这确保了我们的向量数据库与最新信息保持同步。此工作流程在数据源发生变化时触发。这使得人工智能系统能够迅速适应新信息或现有信息的变化。  

2. 通过相似性搜索进行检索

在此工作流程中,当收到用户查询时,系统会将查询转换为嵌入,并基于ANN、KNN或其他算法在更新后的向量数据库中执行相似性搜索。检索到的前k个结果将作为生成响应的上下文,借助LLM的帮助使用。这确保提供的信息相关且基于最新数据。  

当数据源发生任何变化时,仅触发数据处理和摄取工作流程,从而同步更改并更新向量数据库。通过在RAG架构中实施变更检测机制,系统可以无缝同步更新。这确保检索过程始终使用最新数据,而无需对整个系统进行彻底改造。  

RAG模式为企业提供了巨大的好处,因为它将数据同步与数据检索分开。这种解耦意味着对数据源的更新可以高效处理,而不会干扰检索过程,确保用户零停机时间。这种模块化的架构模式允许可扩展性和灵活性。这使得适应不断增长的数据量和不断变化的需求变得更加容易。  

这种方法不仅具有成本效益,而且减少了构建时间,因此对于需要从动态数据源获取最新和准确的信息的企业来说,它是一个高效的选择。这种架构模式帮助工程和产品团队迅速将新数据集成和同步到人工智能系统中。因此,对于频繁变化的数据源,总是建议采用基于RAG的方法,而不是微调方法,以提供可能在决策和运营效率中需要的及时和相关的信息。

模式3:RA-FT(检索增强 - 微调)  

RA-FT已被Meta、微软和加州大学伯克利分校的研究人员推广。该团队最近发表的一篇论文提出了一个新框架,以应对通用RAG框架和领域特定微调(DSFT)方法的限制。Https://arxiv.org/pdf/2403.10131.pdf

为了说明这个框架,研究人员将RAG方法与“开卷考试”进行比较,将微调与“闭卷考试”进行比较。  

RAG的局限性  

在RAG中,上下文是通过对索引进行基于向量的相似性搜索形成的。此搜索可能会出现与查询语义上相近但不一定有意义的文档(或片段),使得LLM在生成连贯且有意义的答案时遇到困难。LLM不知道哪些文档是真正相关的,哪些是误导的。这些“干扰”文档可能会被纳入LLM的上下文,即使它们并不是提供合理答案的良好来源。  

DSFT的局限性  

研究人员还认为,使用DSFT方法时,LLM仅限于其训练内容。它可以进行猜测,甚至给出不正确的答案,因为它无法访问外部来源以获取准确的信息。  

RA-FT如何解决DSFT和RAG模式的局限性?  

为了同时解决DSFT和基本RAG的局限性,RA-FT框架以新方式结合了RAG和微调方法。在RA-FT方法中,LLM的训练方式使其能够从检索过程中生成的相似性搜索上下文中挑选出最有用和相关的文档。  

使用RA-FT时,当模型给出一个问题和一批检索到的文档时,它被教导忽略那些无法帮助回答问题的文档。由于在微调过程中进行的训练,LLM学会了如何识别“干扰”文档,并仅使用有用的、非干扰的文档(或片段)来生成与用户查询相关的连贯答案。  

在RA-FT中,训练数据的准备方式是每个数据点都包括一个问题、一组上下文相关的文档以及相应的思考链式答案。RA-FT将微调与包含问答对的这个训练集结合起来,使用在模拟的不完美检索场景下的文档。这种方法有效地为LLM准备了开卷考试。RA-FT是一种使LLM能够从相关和不相关文档的混合中阅读和推导解决方案的方法。

RA-FT模式的企业战略

由于RAFT结合了RAG和微调方法,因此其成本甚至高于DSFT方法。然而,结果令人印象深刻,这意味着该技术在需要提供高质量输出以及基础数据和来源的用例中是合适的。当您期望从向量相似性搜索中获得混合结果(既有相关文档或块,也有干扰文档或块)时,这种方法将产生最佳结果,并且您不想根据干扰或无用的文档或块生成或构思LLM的响应。对于一个高度监管的行业,将该解决方案整合到现有的生成AI生态系统中将是有益的。

模式4:GraphRAG-知识图谱增强RAG

如您所知,基本的RAG和RAFT基础的方法都严重依赖于底层的矢量数据库及其用于检索分块数据集的各种相似性算法(A-NN或K-NN),这些数据集将用作LLM形成响应的上下文。然而,这种方法面临的最大问题是,当一个具有上下文意义的大段落被分解成小块时,它失去了内在的意义和关系。因此,当执行相似性搜索时,它只选择文档(或块)之间在相关性上词语接近的结果集。主要依赖于基于矢量检索的通用RAG方法面临着几个限制,例如在为用户生成响应时缺乏深层次的上下文理解和复杂的推理能力。

为了解决这一不足,知识图谱数据库作为另一个可以插入现有RAG系统的重要组成部分应运而生,使得您的生成式AI应用在协助用户回答时变得更智能。这种技术称为GraphRAG其中将一种名为知识图谱数据库的不同类型数据库添加到系统中,在RAG的相似性搜索未能产生正确响应时,根据外部特定领域数据帮助辅助内容生成。

GraphRAG如何工作?

GraphRAG是一种先进的RAG方法,使用图形数据库为特定任务检索信息。与将结构化数据存储在行和列表中的传统关系数据库不同,图形数据库使用节点、边和属性来表示和存储数据。这种方法提供了一种更直观和高效的方式来建模、查看和查询复杂系统。GraphRAG通过基于LLM构建的知识图谱连接内容中的概念和实体。

摄取流程

GraphRAG利用大型语言模型(LLM)从文本文档集合中自动生成详细的知识图谱。该知识图谱通过识别和连接相关概念来捕获数据的含义和结构。在索引流程中,系统通过使用LLM提取所有实体、关系和关键主张。

它还检测“社区”或“聚类”,将紧密相关的节点组织在不同的详细层次。这有助于理解数据的整体语义结构。

这些基于社区的摘要提供了整个数据集的全面概述和整篇文章的整体图景。这使得系统能够处理简单的增强检索生成(RAG)方法难以应对的广泛或复杂查询。

检索流程

当用户提出问题时,GraphRAG有效地从知识图谱中检索最相关的信息。然后,它使用这些信息来引导和完善LIAM的响应,提高答案的准确性并减少生成错误或误导性信息的可能性。

GraphRAG模式的企业策略

与基本RAG系统类似,GraphRAG也使用专门的数据库来存储其借助LLM生成的知识数据。然而,与生成嵌入并将其存储在矢量数据库中的成本相比,生成知识图谱的成本更高。因此,GraphRAG应在基本RAG可能难以产生准确答案的场景中使用。

当源数据高度动态(即频繁变化)时,您需要重建语料库的图谱并相应更新图数据库。每当源数据发生变化时重建图数据库可能成本昂贵,但为维持同样的全面理解是必要的。

在企业环境中,建议将GraphRAG与基本RAG集成,以创建更有效的生成式AI系统。这样,如果基本RAG未能检索到所需结果,系统可以在GraphRAG数据库中搜索上下文,并为用户生成响应,而不是在系统拥有正确答案和上下文但分散在不同块或文档中且未聚类时产生幻觉或不生成响应。将GraphRAG与基本RAG系统相结合使得AI应用更具稳健性。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅