2026年7月9日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

RIG,Google 最新推出的RAG 替代方案

发布日期:2024-10-14 21:45:58 浏览次数: 4468
作者:机智流

微信搜一搜,关注“机智流”

上个月,Google 在 Huggingface[1] 和 Kaggle[2] 上开源了两个新模型:datagemma-rag-27b-it 和 datagemma-rig-27b-it。其中新提出的 RIG(Retrieval Interleaved Generation)检索交错生成,提供了 LLM 与外部数据库交互的新思路。

RAG VS. RIG

熟悉 LLM 的同学都知道,LLM 是通过训练数据学习到的知识,因此使用大模型的时候会遇到“幻觉”和“过时”等问题,这都源于训练数据库没有包含相应的知识或者训练用的数据没有及时更新。考虑到 LLM 训练的昂贵的时间和金钱成本,在真是的应用中,通常会采用 RAG(Retrieval Augmented Generation)检索增强生成 技术来给 LLM “外挂” 一个最新的数据库,通过检索的方式利用 LLM 的能力来相应用户关于特定数据或最新数据的问题。

RAG 工作流程:

  1. 用户提交查询:用户向 LLM 提交查询或提示。
  2. 数据检索:LLM 将用户的查询转换数据库问题提交外部数据进行检索。
  3. 响应生成:LLM 依据内部拥有的知识库和检索到的结果进行答案的生成。

如图所示,当询问“再生资源的使用是否增加的时候?”,RAG 应用通过检索到的数据表进行数据获取,得到了数据准确的回答。

这次开源的 RIG 模型则采用了另一种模式 检索交错生成,这里的交错是指在生成部分响应和检索外部数据之间交替进行。该模型不会等待检索完所有数据后再生成响应;相反,它将这两个任务交错进行,因此检索和响应生成同时进行。

RIG 的流程可以分为几个关键步骤:

  1. 用户查询提交:用户向 LLM 提交查询或提示。
  2. 部分响应生成:LLM 开始根据它已经拥有的内部知识生成响应。但是,此响应可能包括需要外部数据的部分的占位符或推测性答案。
  3. 实时数据检索:当 LLM 识别到缺失或不完整的信息时,它会实时查询外部来源(例如,数据库、知识图谱或基于 Web 的 API)。该模型可以进行多次检索调用,从而使用新获取的数据丰富响应。
  4. 交错检索生成的:在生成响应期间,模型在生成响应的各个部分和根据需要获取数据之间动态交替。例如,如果 LLM 以“Renewable energy sources now ...”开头,它会在完成该响应部分之前暂停以检索特定的再生资源利用率数字。
  5. 最终响应:一旦检索并整合了所有必要的数据,LLM 就会完成响应并将其返回给用户。

RIG 效果

Google 这次的两个开源模型都是针对 Data Commons 进行的优化和测试,旨在解决大模型和真实数字数据交互的场景。“Data Commons 是一个公开可用的知识图谱,包含数十万个统计变量中超过 2400 亿个丰富的数据点。它从联合国 (UN)、世界卫生组织 (WHO)、疾病控制和预防中心 (CDC) 以及人口普查局等受信任的组织获取这些公共信息。将这些数据集组合成一组统一的工具和 AI 模型,使政策制定者、研究人员和组织能够寻求准确的见解。”

同时,Google 也在Colab[3]开放了两个模型的 Notebook,方便体验。现在让我们看一下 RIG 在 Data Commmons 上的真实使用效果。

问题:What progress has Pakistan made against health goals?

datagemma-rig-27b-it 的回答:

Pakistan has made some progress against its health goals, but significant challenges remain.

Here are some key points:

Progress made:

Increased life expectancy: Life expectancy at birth has increased from [DC#1(62.102 yr [1] || 61.8 years)] in 2000 to [DC#2(66.269 yr [2] || 67.2 years)] in 2020.
Reduced maternal mortality: Maternal mortality ratio has declined from [DC#3(387.3715 Per 100,000 live births [3]* || 276 per 100,000 live births)] in 2000 to [DC#4(177.7277 Per 100,000 live births [4]* || 140)] in 2018.
...

FOOTNOTES
[1] - Per datacatalog.worldbank.org, value was 62.102 yr in 2000. See more at https://datacommons.org/explore#q=what%20was%20the%20life%20expectancy%20in%20Pakistan%20in%202000%3F&mode=toolformer_rig 
[2] - Per datacatalog.worldbank.org, value was 66.269 yr in 2020. See more at https://datacommons.org/explore#q=what%20was%20the%20life%20expectancy%20in%20Pakistan%20in%202020%3F&mode=toolformer_rig 

...

在当前版本的 RIG 中,所有数值数据都有 DC 和 LLM 自生成两种来源,方便用户进行比较和筛选,同时每一个数据还会给出精确到条目的来源。

结论

从上述回答中可以看出,RIG 和 RAG 一样,主要作用是减少 LLM 使用时的幻觉,通过将实时数据检索与生成过程交织在一起,RIG 在形成响应时持续查询可信数据源,有助于模型将其输出建立在现实世界的事实信息中,从而显著降低幻觉的风险。

RIG 的另一个显著优势是它能够在生成响应的同时实时适应。与 RAG 在数据在生成响应之前仅检索一次不同, RIG 在响应生成期间是动态交错检索。如果 LLM 遇到多条缺失或不完整的信息,它可以迭代地获取数据,同时优化其响应。

在实际使用中,RIG 更能有效发挥小规模参数 LLM 的性能。RAG 将所有查询与结果单词输入 LLM,响应的答案严重依赖 LLM 上下文长度的处理能力。RIG 的路线只针对特定数据检索,对于上下文长度的处理能力要求更也更低;同时,RIG 对于检索不到的数据会使用占位符的形式提醒用户,其对提供的数值答案相对可靠性更强,更适合对数值数据要求高的敏感低功耗场景,如价格客服、金融服务和医疗服务等。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅