使用 LangChain 建立一个会话式的 RAG Agent 系统

发布日期：2024-11-13 11:30:24 浏览次数： 3309

作者：PyTorch研习社

微信搜一搜，关注“PyTorch研习社”

让我们继续优化《使用LangChain建立检索增强生成（RAG）系统》一文中的 RAG 系统。

在许多问答应用程序中，我们希望允许用户进行来回对话，这意味着应用程序需要记住过去问题和答案，以及将这些问题和答案纳入当前思维的逻辑。

在本文中，我们重点介绍如何添加整合历史消息的逻辑。

我们将介绍两种方法：

链，我们始终在其中执行检索步骤；
Agent，我们让 LLM 自行决定是否以及如何执行检索步骤（或多个步骤）。

聊天记录

聊天记录是用户与聊天模型之间对话的记录。它用于在整个对话过程中保持上下文和状态。聊天记录是一系列消息，每条消息都与特定角色相关联，例如“user”、“assistant”、“system”或“tool”。

大多数对话都以设置对话上下文的系统消息开始。接下来是包含用户输入的用户消息，然后是包含模型响应的助手消息。

助手（assistant）可以直接响应用户，或者如果配置了工具请求，则调用工具来执行特定任务。

因此，完整的对话通常涉及两种交替消息模式的组合：

用户和助手代表来回对话。
助手和工具消息表示的 agent 工作流，其中助手正在调用工具来执行特定任务。

由于聊天模型对输入大小有最大限制，因此管理聊天记录并根据需要对其进行修剪以避免超出上下文窗口非常重要。

在处理聊天记录时，保留正确的对话结构至关重要。管理聊天记录的关键准则：

对话应遵循以下结构之一：

第一则消息是“user”消息或“system”消息，后跟“user”消息，然后是“assistant”消息。
最后一条消息应该是“user”消息或包含工具调用结果的“tool”消息。

使用工具调用时，“tool”消息应仅跟在请求工具调用的“assistant”消息之后。

理解正确的对话结构对于在聊天模型中正确实现记忆至关重要。

可以参考《使用 LangChain 构建一个有记忆的聊天机器人》

原始的 RAG 系统

我们首先将《使用LangChain建立检索增强生成（RAG）系统》的关键代码抽取出来：

我略过了加载文档、拆分文档和生成索引的步骤，因为这和本文关系不大。

添加聊天记录

我们构建的 RAG 链直接使用输入查询来检索相关上下文。但在对话设置中，用户查询可能需要对话上下文才能被理解。例如，考虑以下的会话：

用户：“物理学对马斯克有什么影响？”

AI：“物理学为马斯克提供了一个理解复杂和反直觉事物的研究框架，比如量子力学。它教会他使用第一性原理思考问题，这是一种将事物分解到最基本实质再进行推理的方法，对探索未知领域非常重要。这种方法帮助他在创新时能追溯问题的本质，从而产生独创性的解决方案。”

用户：“马斯克对这个学科有什么看法？”

为了回答第二个问题，我们的系统需要理解“这个学科”指的是“物理学”。

针对这个问题，我们需要更新现有的 RAG 链：

提示模板：更新我们的提示模板以支持历史消息作为输入。
上下文问题：添加一个子链，该子链接受最新的用户问题并在聊天历史的上下文中重新表述它。这可以简单地被认为是构建一个新的“历史感知”检索器（retriever）。而之前我们有：

查询 -> 检索器

现在我们将有：

（查询，对话历史）-> LLM -> 重新表述的查询 -> 检索器

首先，我们需要定义一个子链，该子链接收历史消息和最新的用户问题，如果问题引用了历史信息中的任何信息，则重新表述该问题。

我们将使用一个包含名为“chat_history”的 MessagesPlaceholder 变量的提示。这允许我们使用“chat_history”输入键将消息列表传递给提示模板，这些消息将插入在系统消息之后和包含最新问题的人工消息之前。

请注意，我们利用辅助函数 create_history_aware_retriever 来完成此步骤，该函数管理 chat_history 为空的情况，否则按顺序应用 prompt | llm | StrOutputParser() | retriever。

create_history_aware_retriever 构造一个链，该链接受键 input 和 chat_history 作为输入，并具有与检索器相同的输出模式。

该链将输入查询的改写添加到我们的检索器中，以便检索包含对话的上下文。

现在我们可以构建完整的 QA 链。我们将使用 create_stuff_documents_chain 生成 question_answer_chain，输入键为 context、chat_history 和 input——它接受检索到的上下文以及对话历史记录和查询以生成答案。更详细的解释在这里

我们使用 create_retrieval_chain 构建最终的 rag_chain。此链按顺序应用 history_aware_retriever 和 question_answer_chain，保留中间输出（例如检索到的上下文）以方便使用。它具有输入键 input 和 chat_history，并在其输出中包含 input、chat_history、context 和 answer。