我要投稿

对话式 RAG：让你的问答应用更“聪明”

发布日期：2025-08-24 08:59:23 浏览次数： 1710

作者：PyTorch研习社

微信搜一搜，关注“PyTorch研习社”

在很多问答（Q&A）应用中，用户希望和机器人进行自然的多轮对话。这意味着应用不仅要能回答单个问题，还需要具备“记忆”功能，把过去的问题和答案利用起来，才能让对话连贯。

本文将介绍如何在 RAG（Retrieval-Augmented Generation，检索增强生成） 的基础上，扩展支持对话交互。

🔑 核心思路

传统的 RAG 通常是这样的流程：

👉 用户输入问题 → 检索文档 → 生成答案

在对话场景中，我们需要把 历史消息 纳入考虑。本文介绍了两种方式：

链（Chain）：只执行一次检索步骤；
智能体（Agent）：允许模型根据需要多次检索，直到找到合适的答案。

🗂️ 消息序列：更自然的对话状态表示

在对话式应用里，不同类型的消息都会被记录：

HumanMessage：用户输入
AIMessage：助手回复
ToolMessage：工具返回结果（比如检索到的文档）

整个对话过程就像一条消息链，模型不仅能看到用户和助手的对话，还能结合工具调用结果来生成更合理的答案。

🔍 自动生成检索查询

在多轮对话中，用户的问题往往需要结合上下文才能理解。比如：

用户：耐克在美国有多少个配送中心？
AI：耐克在美国有 8 个配送中心。
用户：在美国之外有哪些？

这时模型会自动把用户模糊的问题改写为完整的检索查询：
👉 “耐克在美国之外有哪些配送中心？”

这样即使用户没说全，模型也能自动补全上下文。

⚙️ 架构设计

应用的核心流程可以抽象为三个节点：

用户输入节点：生成检索请求或直接回复；
检索工具节点：执行向量数据库查询；
响应生成节点：基于检索结果生成最终答案。

这种设计保证了灵活性：

用户打招呼时，可以直接回复；
用户提问时，则会触发检索和推理。

🧠 让机器人拥有记忆

要支持多轮对话，应用需要保存历史对话。文章中介绍了使用 LangGraph 的持久化机制：

每一轮消息都会追加到状态中；
通过设置 thread_id，不同会话线程能被独立保存；
用户可以随时继续之前的对话，机器人还能记住上下文。

🚀 应用效果

输入：“你好” → 系统直接回复，不触发检索。
输入：“耐克，包括匡威在美国有多少个配送中心？” → 检索并回答。
输入：“在美国之外有哪些？” → 自动补全查询，并基于历史对话给出答案。

这让应用更像一个真正的对话助手，而不是“单问单答”的工具。

📌 总结

对话式 RAG 的关键点：

用消息序列管理对话状态；
借助工具调用让模型自动生成检索查询；
利用持久化机制，让应用拥有“记忆”。

通过这些改造，你的问答机器人就能更自然地理解上下文、灵活检索信息，并保持连贯对话。

✨ 未来我们还可以进一步探索：如何在对话中结合更复杂的多工具协作，甚至让智能体像人一样自由选择信息来源。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-10-29

RAG—Chunking策略实战｜得物技术

2025-10-29

RAG 让你的 AI 更聪明

2025-10-28

多少做RAG的人，连分词都搞不定? Milvus Analyzer指南

2025-10-28

先分块再向量化已经过时！先embedding再chunking才是王道

2025-10-28

AI检索增强中路由模型的使用

2025-10-28

HybRAG：混合文本和知识图谱的RAG框架

2025-10-28

“生成幻觉”（Hallucination）和“知识时效性”不足引发的架构范式变革

2025-10-27

RAG优化技巧

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG彻底爆了！一文掌握其效果优化的架构设计及核心要点

2025-09-15

从原理到落地：RAG 技术全解析，手把手教你搭建专属知识库

2025-09-02

响应速度提升300%、检索准确率90%：RAG如何让企业知识“活”起来赚钱？

2025-08-05

优化 GraphRAG：LightRAG的三大改进

2025-08-18

RAG系统全景：架构详解与落地实践指南

2025-08-25

高质量AI知识库应用的前提：选对向量数据库

2025-08-25

一文搞懂大模型：何为深入理解RAG？

2025-08-25

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

2025-09-03

别再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？

2025-08-20

万字长文详解腾讯优图RAG技术的架构设计与创新实践

2025-09-08

大家都在问

Embedding与Rerank：90%的RAG系统都搞错了！为什么单靠向量检索会毁了你的AI应用？

2025-10-04

存算一体破局向量检索瓶颈，IBM放出王炸VSM：性能飙升100倍，能效碾压GPU千倍，RAG要变天？

2025-09-30

您应该为您的 RAG 系统使用哪种分块技术？

2025-09-10

关于多模态应用的几个疑问，以及多模态应该怎么应用于RAG？

2025-09-10

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

2025-09-03

RAG检索后如何应用更有效？

2025-08-28

一文搞懂大模型：何为深入理解RAG？

2025-08-25

别再往AI的知识库塞奇怪的东西了，什么样的知识适合作为RAG知识库？

2025-08-20

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB