我要投稿

图解RAG

发布日期：2024-10-08 21:36:04 浏览次数： 2586

作者：Qingwave

微信搜一搜，关注“Qingwave”

RAG(Retrieval-Augmented Generation, 检索增强生成)是一种将信息检索与生成模型结合的方法，也是企业落地大模型应用最常见的方式。

什么是RAG

RAG接受用户输入，从一个大型文档集合中检索相关信息，然后将用户问题与检索信息发送到大模型，大模型生成最终答案。

RAG可以借助外部知识源，从而提升回答的准确性和信息丰富度，相当于为LLM配置了一个书架，虽然有些知识不知道，但可以参考相关书籍从而获取不错的答案。可以用来做文档问答系统、客服系统、企业内私有数据的问答系统。

工作原理

基础RAG分为三个阶段Indexing、Retrieval与Generation:

「Indexing」

将知识库拆分成固定大小的块
选择合适的Embedding模型将数据块向量化，存放在VectorDB(向量数据库)中

「Retrieval」

当用户查询时，先将查询转换为向量
然后在VectorDB中匹配相关内容

「Generation」

将用户输入与检索信息填入Prompt发送给大模型
大模型返回结果

RAG范式

RAG应用根据复杂程度可分为三类：

Naive RAG(朴素RAG)
Advanced RAG(高级RAG)
Modular RAG(模块化RAG)

Naive RAG

Naive RAG遵循传统的RAG索引、检索和生成过程。简而言之，用户输入用于查询相关文档，然后这些文档与提示相结合并传递给模型以生成最终响应。如果应用程序涉及多轮对话交互，则可以将对话历史集成到提示中。

Naive RAG实现简单但有一些局限性，例如精度低（没有检索到相关片段）、召回率低（未能检索到所有相关片段）。

Advanced RAG

Advanced RAG在Naive RAG的基础上，通过一些技术手段提高了检索质量，涉及优化预检索、检索和后检索过程。

「预检索」优化了数据索引过程，方法包括：增强数据粒度、优化索引结构、添加元数据等。
「检索中」旨在提高检索的准确性，常见方法有：查询重写、多路召回、优化嵌入模型等。
「检索后」通过检查重排（Rerank）、上下文压缩等。

Modular RAG

Modular RAG整合了Advanced RAG的各种模块和技术，以改善整体的RAG系统。包括搜索、路由、内存、融合等模块，朴素RAG与高级RAG只是其中的特例。

RAG框架

目前比较流行的RAG框架有LlamaIndex与LangChain，可以根据使用场景选择合适的框架，当然这些框架也在不断发展。

LlamaIndex是一个构建大模型应用的数据框架，从名字可以看出专注于大模型应用数据处理，比如加载、索引、查询等。
LangChain是一个通用的大模型应用开发框架，使用模块化设计方便开发人员构建大模型应用，比如问答系统、智能客服、智能代理等。

RAG评估

RAG应用的流程较长，每一步都会影响到最终效果，那么怎么知道我的RAG应用哪里需要优化呢？这就需要用到RAG评估。

通过设置一些指标，常见的如Correctness(答案准确性)、Answer Relevancy（答案相关性）、Faithfulness（忠诚度）、Context Precision（上下文精度）等，来评估应用各个阶段的表现情况，可以人工打分也可以借助LLM来实现，根据打分结果来做对应的优化。

总结

本文总结了RAG应用的相关内容，包括原理、开发范式、常用框架以及评估等。当然RAG应用还面临了不少挑战，随着LLM的快速发展，RAG必定也会推陈出新。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-06

RAG 落地全干货深度分享：从“效果不理想”到生产级 RAG 系统的进化之路

2026-02-06

效率神器 Claude-Mem：终结 AI “金鱼记忆”！自动保存上下文、可视化记忆流，开发体验提升 10 倍！

2026-02-06

告别“伪智能”代码：用 Spec + RAG 打造真正懂你的AI程序员

2026-02-05

向量，向量化，向量数据库和向量计算

2026-02-05

从 RAG 到 Agentic Search，一次关于信任 AI 判断的认知升级

2026-02-04

Claude Cowork 真能替换 RAG ？

2026-02-03

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

RAG 深度解读：检索增强生成如何改变人工智能

2025-12-04

大模型RAG入门宝典｜从AI搜索到实战搭建，小白&程序员必收藏的检索增强指南

2025-12-03

RAGFlow v0.22.0 发布：数据源同步、变量聚合、全新管理界面与多项重大更新

2025-11-13

企业级 AI Agent规模化落地的避坑指南，就藏在这四大趋势里

2025-12-02

5步构建企业级RAG应用：Dify与LangChain v1.0集成实战

2025-11-13

2026 年你需要了解的 RAG 全解析

2026-01-15

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

Embedding模型选型思路：相似度高不再代表检索准确（文末附实战指南）

2025-12-07

为什么Claude Code不用RAG？

2025-12-23

从 RAG 到 Context：2025 年 RAG 技术年终总结

2025-12-18

大家都在问

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

为什么 RAG 越用越慢？如何反向调优？

2026-01-19

NotebookLM如何在48小时内分析2万份论文？

2026-01-12

都有混合检索与智能路由了，谁还在给RAG赛博哭坟？

2026-01-08

如何用NotebookLM，把枯燥的财报解读成精美的PPT？

2026-01-02

为什么Claude Code不用RAG？

2025-12-23

终于，NotebookLM 和 Gemini 合体了。这是什么神之更新？

2025-12-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean