2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

LLM对于行业术语出现幻觉怎么解?快来试试Golden Retriever 指代消歧

发布日期:2024-09-04 07:33:01 浏览次数: 2983
作者:AI 博物院

微信搜一搜,关注“AI 博物院”

今天来分享一篇深度好文:《Golden-Retriever: High-Fidelity Agentic Retrieval Augmented Generation for Industrial Knowledge Base》,我们知道企业落地RAG系统有以下常见痛点:

  1. 技术公司维护着大量的专有文档,如培训材料、设计文档和研究成果。
  2. 工程师,尤其是新员工,需要快速查询这些文档或吸收其中的新知识。
  3. 这些领域特定的文档通常包含许多技术社区特有的缩写和术语,使得导航变得复杂。

而这篇文章提出了一个概念:Golden-Retriever,旨在文档检索前增加了一个基于反思的问题增强步骤,并相应地增强问题,以克服传统的LLM微调和RAG框架在特定领域术语和上下文解释方面的挑战。Golden-Retriever通过识别和澄清术语,并增强问题,实现了对文档检索前的问题增强。这种全面的增强使RAG框架能够提供清晰的上下文并解决歧义,从而显著提高了检索准确性。通过在特定领域问答数据集上进行评估,证明了Golden-Retriever的优异性能,为高效地整合和查询工业知识库提供了有力的解决方案。

介绍

当前的检索增强生成 (RAG) 技术在处理工业知识库中特定领域查询时,往往难以达到理想的效果。例如,对于一个问答问题“三星或海力士NAND芯片的PUC架构是什么?”的场景,RAG 误解了"PUC"这个专业术语,错误地将其解释为“公共事业委员会(Public Utilities Commission)”而不是正确的“细胞下外围设备(Periphery Under Cell)”。这种误解突显出了幻觉问题,即模型基于模糊的输入生成了不正确或无意义的信息。

尽管已有技术如Corrective-RAG和Self-RAG试图通过在文档检索步骤后修改响应来改进结果,但如果初始检索因误解术语或上下文缺乏而存在缺陷,则这些后处理技术无法完全修正不准确性。

此外,这些方法主要集中在改进检索后生成的响应上。然而,当检索到的文档本身不相关时,这些办法其实效果有限。它们并未直接解决根源问题,也就是用户问题和初始检索过程之间的歧义性。

另一种方法,由Kochedykov等人提出,试图通过将模糊问题解构为抽象语法树 (AST),并据此合成SQL查询以解决模糊问题。这种方法虽然提升了查询的保真度,但它只限于SQL查询,并不能推广到更广泛的问答场景。图示揭示了这一局限性,说明该方法在消除歧义和构造查询上虽然更有效,但对于重要的上下文和术语解释的普通检索任务来说,它并不适用。

我们提出了 Golden-Retriever,这是 RAG 的⼀种代理衍⽣产品,其特点是在⽂档检索之前进⾏基于反射的问题增强,使 RAG 能够检索到最相关的⽂档,尽管术语含糊不清且缺乏上下⽂。下面是对这三种方式的流程说明:

方法

Golden-Retriever由离线和在线两部分组成。离线部分是部署知识库聊天机器人之前进行的数据预处理步骤。在线部分是每次用户提问时发生的交互过程,下面给出对应的流程图,左侧是Golden-Retriever在线推理部分的工作流程图。右侧是系统与LLM在工作流程中间步骤的示例交互。系统提示LLM生成中间响应,这些响应被保存、访问,并用于工作流程的步骤。

2.1 LLM对文档进行总结

Golden-Retriever的离线部分专注于增强文档数据库,以提高检索到的文档的相关性。此过程首先收集公司的原始文档,例如幻灯片、嵌入文本的图像和表格,以形成知识库。这些文档的格式和内容通常各不相同,缺乏清晰的叙述,这会导致使用RAG查询时相关性得分较低。

为了解决这个问题,我们使用OCR从这些文档中提取文本,并将其拆分成更小、更易于管理的块进行处理。对于Meta-Llama-3模型,这些块每个大约有4,000个标记。然后使用LLM处理每个块,以从领域专家的角度生成摘要,利用LLM的语义理解和上下文学习能力。这些增强数据被添加到文档数据库中,使其在查询时更可能检索到相关文档。

2.2 识别术语

在线流程的第一步是识别用户问题中的术语和缩写。此步骤至关重要,因为许多特定领域的问题都包含需要澄清以确保准确解释的专业术语。为了识别这些术语,我们使用了一个提示模板,该模板旨在指导LLM提取并列出输入问题中发现的所有术语和缩写。此过程可以确保识别所有可能产生歧义的术语,从而有助于在后续步骤中解决它们。已识别的术语和缩写以结构化格式输出供进一步处理。

2.3 识别背景

在识别出专业术语后,确定提问的上下文非常重要,因为术语的含义在不同上下文中可能有很大差异。例如,“RAG”在人工智能的上下文中可能表示“检索增强生成”,而在遗传学中可能表示“重组激活基因”。为了准确解释上下文,我们使用了与专业术语识别类似的反思步骤,涉及设计提示模板。

虽然可以使用更简单的方法,例如基于转换器的文本分类器,对用户进行分类意图,但这将需要一个专门的训练数据集。这对于我们的应用程序来说是不切实际的,因为创建这样一个数据集需要大量的努力和资源。

相反,我们选择了“使用LLM作为后端”的方法,尽管会招致较高的计算成本,但无需专用的训练数据集,可以高效运行在本地服务器上。事先识别上下文可以帮助我们准确理解和处理用户输入。

2.4 查询术语

一旦确定了术语和上下文,下一步就是查询术语词典,获取已识别术语的扩展定义、描述和注释。此步骤对于向用户提供术语的准确解释至关重要,确保扩展问题清晰无歧义。

此过程涉及使用在2.2节中确定的术语列表查询SQL数据库。术语列表被插入到SQL查询模板中,然后经过处理从术语词典中检索相关信息。检索到的信息包括扩展名称、详细描述以及任何有关术语的相关注释。

我们选择不使用LLM直接生成SQL查询,使用LLM生成SQL查询可能会带来查询质量和安全性方面的不确定性,并且还会增加推理成本。相反,通过使用基于代码的方法来合成SQL查询,我们可以确保查询是可验证的安全和可靠的。

从这一步获得的详细信息对于补充用户的原始问题至关重要。它允许准确的上下文和术语解释,这对于RAG流程检索最相关的文档并生成精确的答案至关重要。

2.5 扩充问题

确定了术语定义和上下文后,下一步是扩充用户的原始问题以包含这些附加信息。此扩充可确保RAG流程通过提供清晰的上下文并解决问题中的任何歧义来检索最相关的文档。

此步骤涉及将原始问题与上下文信息以及从2.3和2.4部分获得的详细术语定义相结合。增强型问题明确地陈述了上下文,并澄清了任何模棱两可的术语,从而有助于增强文档检索。

该过程是自动化的,代码将原始问题以及上下文和术语识别步骤的结果组合成一个结构化的模板。然后,增强问题将替换用户的原始问题,并用作RAG框架的输入,确保检索到最相关、最准确的文档。

2.6 查询未命中响应

在某些情况下,系统可能在词典中找不到某些术语的相关信息。为了处理这种情况,GoldenRetriever 有一个后备机制,可以合成一个响应,表明数据库由于缺少信息无法回答问题。

系统提示用户检查术语的拼写或联系知识库管理员添加新术语。此步骤可确保系统保持高保真度并避免生成不正确或误导性的响应。未识别的术语适合于响应模板,提示用户检查拼写并联系知识库管理员添加新术语。

评估

使用针对工程师新员工培训文档中的六个不同领域的测验作为测试问题。所有问题都是多项选择题。显示的是五次试验的平均得分。最佳得分用粗体显示。

通过在特定领域的问答数据集上的评估,Golden-Retriever在多个开源LLM上表现出色,与传统的RAG方法相比,显著提高了答案的准确性。与Vanilla LLM和RAG相比,Golden-Retriever分别将Meta-Llama-3-70B的总分提高了79.2%和40.7%。在测试的所有三种大型语言模型中,平均将得分提高了57.3%。

总结

Golden-Retriever 主要完成了两项任务:首先,它在构建企业数据库时利用LLM生成摘要信息来替代原始文档,以提高检索的召回率。其次,利用术语库重构原始问题,进行指代消歧。

在方案实现上,通过术语库重构问题确实可以避免歧义,但是这需要多次调用LLM进行术语识别、上下文理解和问题重构等操作。在实际工业落地实施中,效率和术语库的规模可能会成为关键考虑因素。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅