CoA-Agent模式解决长文本RAG的思路：兼看UniOQA大模型知识图谱问答框架

发布日期：2024-06-06 12:56:20 浏览次数： 3180

作者：老刘说NLP

微信搜一搜，关注“老刘说NLP”

今天是2024年6月6日，星期四，北京，天气晴。

我们来看看两个问题，一个是关于RAG中使用Agent模式解决长文本RAG的思路，另一个是关于大模型与知识图谱的结合，UniOQA大模型知识图谱问答框架实现思路，都很干货，感兴趣的可以看看。

问题1：使用Agent模式解决长文本RAG的思路

有效地处理长文本上下文已成为大型语言模型（LLMs）面临的关键问题。目前出现了两种常见策略：1）减少输入长度，如通过检索增强生成（RAG）检索相关片段；2）扩展LLMs的上下文窗口限制。然而，这两种策略都存在缺点：输入减少无法保证覆盖所需信息的部分，而窗口扩展则难以专注于解决任务所需的相关信息。

为了缓解这些限制，《Chain of Agents: Large Language Models Collaborating on Long-Context Tasks》(https://arxiv.org/abs/2406.02818)提出Chain-of-Agents（CoA）框架，该框架通过自然语言实现多代理协作，以在长文本任务中跨多个LLMs实现信息聚合和上下文推理。

CoA包含两个阶段。在第一阶段，负责不同长文本块的一系列工作代理进行协作，收集回答给定查询所需的证据。

为此，这些工作代理按顺序进行读取和处理，每个工作代理都接收前一个工作代理的消息，并将有用的更新信息传递给下一个工作代理，这块的协作逻辑可以看看如下prompt

这一步的实现思想，可以看看这个伪代码：

在第二阶段，管理代理接收来自最后一个工作代理的完整证据，并生成最终响应。

对应的形式化建模为：

问题2:UniOQA大模型知识图谱问答框架实现思路

《UniOQA: A Unified Framework for Knowledge Graph Question Answering with Large Language Models》(https://arxiv.org/abs/2406.02110)提出了UniOQA，一个集成了两个互补并行工作流的统一框架。

如上图所示：

包含两个并行工作流的框架：

1、翻译器。用来将query转换成对应的GQL查询语句

该翻译器通过微调大型语言模型（LLM）来生成Cypher查询语言（CQL），并修改CQL中的实体和关系。为了增强表示能力，对LLM进行微调，将问题转换为Cypher查询语言（CQL），解决了与受限语义理解和幻觉相关的问题；

随后，引入了实体和关系替换算法，以确保生成的CQL的可执行性，同时，为了增强问答的整体准确性，进一步将检索增强生成（RAG）过程应用于知识图谱；

其中，微调后的Baichuan2-7B表现较好，用它来生成CQL，LLMs可以在没有正确实体和关系的情况下，将自然语言问题初步转换为CQL，但是有错误。

例如，以图1中的示例为例，微调后的LLM可以生成类似于以下内容的CQL：“match(:ENTITY{name:"Jackie Chan"})-[:Relationship{name:"classic movie"}]->(m) return distinct m.name limit 3”。

然而，知识图谱中的正确实体是“Jackie Chan [Hong Kong actor]”而不是“Jackie Chan”。在没有任何提示的情况下，生成正确的实体是困难的。关系也是如此。仅由模型生成的CQL可能不完全正确，因此需要在下一节中进行实体和关系的替换，也就是ERR算法。

其实ERR算法做的就是实体对齐，本质上是用知识图谱中最语义相似的实体和关系来替换CQL中的实体和关系。例如：

如算法1所示，输入是原始列表{?:??}，输出是修正后的列表{?:??}。按顺序遍历每个?和????对，并利用正则表达式进行实体和关系提取，形成实体集?和关系集?；

对于?中的每个实体?，从知识图谱中检索所有相关实体??以形成候选集，然后，利用Baichuan2-7B和手动编写的指令来选择最终实体，最后，获得修正后的实体集?′；

在修正关系集?中的第一个关系?时，获得一个候选关系集，对于关系集合中的每个元素，计算语义相似度，并选择前k个，从而获得修正后的关系集，最后，基于执行准确率选择最佳的正式CQL，并输出修正后的对列表{?:??}。

但这个步骤，存在一个明显的问题，就是错误地选择了最佳的实体或关系。

2、搜索器。该搜索器在知识图内部采用直接搜索方法来检索与所提出问题相关的答案。

这个阶段，采用的是GRAG，它代表将检索增强生成框架应用于知识图谱，以直接检索答案

具体地，采用传统的信息检索方法来检索与主题实体相关的子图作为LLMs的上下文。首先，训练一个实体提取模型来从问题中提取实体（例如，对于问题：“我想知道一些关于中国的信息”，问题中的实体是“中国”）；

在获得实体后，为了弥补实体提取中可能存在的潜在不准确性，使用模式匹配查询从Elasticsearch数据库中检索与实体相距一跳的三元组作为上下文信息；

检索到的知识以三元组[头，关系，尾]的形式呈现，其中每个三元组代表一个推理路径的隐式表达。然后，这些聚合的三元组通过使用模板（例如，“头的关系是尾。”）转换为自然语言；

随后，将自然语言格式的知识与问题合并并输入到LLM中。最后，提示LLM基于提供的外部知识生成答案。

最后，通过动态决策算法对两个工作流产生的答案进行优化，得出最终结果，具体地，优先使用Translator的答案，并将Searcher的答案作为补充。

这个公式可以看看：

其中，Q表示自然语言问题，?(·)表示来自Translator的答案，?1(·)表示答案的F1分数，?(·)表示来自Searcher的答案。??????(?,?)表示在?和?之间选择F1分数更高的答案。σ是一个介于0到1之间的决策因子，决定了决策的阈值。

但其中有个问题，?1(·)表示答案的F1分数在推理阶段是没法估计出来的，所以这个很难实施。

可以看看最终的效果：

总结

本文主要讲了两个问题，一个是关于RAG中使用Agent模式解决长文本RAG的思路，另一个是关于大模型与知识图谱的结合，UniOQA大模型知识图谱问答框架实现思路。其中更多的都是流程化的思想，依旧有许多优化空间。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-30

教程：如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

2026-06-30

知识库不是文件堆——我把RAG准确率从60%调到了92%

2026-06-30

本体论语义建设新思路，另类RAG来解决检索问题

2026-06-30

别把RAG当架构：Ontology（本体）才是Agent的业务世界

2026-06-29

PixelRAG：伯克利团队颠覆传统 RAG，用截图代替文本检索! 28 天狂揽 3000+ Star！

2026-06-29

腾讯WeKnora开源详解（三）：检索引擎与生态集成

2026-06-29

腾讯开源WeKnora详解（二）：知识库与对话核心能力

2026-06-29

RAG又被绕开了，MIT用MEMO给AI外挂记忆脑

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

2026 年做搜索就是做 Agent Memory

2026-04-23

RAG进化了，深扒Claude Code源码中RAG高级技巧

2026-04-02

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

2026年知识库幻觉根治指南：从 Naive RAG 到 Agentic RAG

2026-05-14

大家都在问

谷歌发布OKF（Open Knowledge Format）规范，它与Karpathy的LLM-wiki是什么关系？

2026-06-23

RAG 的尽头，是 SQL？

2026-06-23

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

到底是谁会相信RAG已死啊？

2026-05-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw