【一文读懂】RAG的重要组成-Embedding Model

发布日期：2024-09-04 11:30:24 浏览次数： 9639

作者：码农随心笔记

微信搜一搜，关注“码农随心笔记”

根据我的观察，在各个热门的RAG引擎（如AnythinRAG，RAGFlow，Dify）中，都包含了Embedding Model（嵌入模型），那嵌入模型这个强大的工具，在RAG引擎中究竟起到什么作用呢？本篇我将会通过通俗易懂的方式，为各位同学揭开它的神秘面纱。

什么是Embedding

在学习嵌入模型之前，首先要搞明白什么是Embedding ？Embedding 是将离散的非结构化数据转换为连续的向量表示的技术。在自然语言处理中，Embedding 常常用于将文本数据中的单词、句子或文档映射为固定长度的实数向量，使得文本数据能够在计算机中被更好地处理和理解。通过 Embedding，每个单词或句子都可以用一个实数向量来表示，这个向量中包含了该单词或句子的语义信息。

以文本处理为例，假设你有一句话：“猫喜欢鱼。”在计算机中，单词是以文字的形式存在的，但计算机并不能直接理解这些文字。Embedding 的作用就是把每个单词转化为一个向量，例如把“猫”转化为一个向量 [0.1, 0.2, 0.3]，把“鱼”转化为另一个向量 [0.4, 0.5, 0.6]。这样，计算机就能用这些向量来进行各种计算，比如找出“猫”和“鱼”之间的关系。

这些向量不仅仅是随机的数字，而是通过学习得到的，使得在某些特定的任务上，它们能够很好的表示数据之间的相似性和关系。例如，相似的词（如“猫”和“狗”）在向量空间中会比较接近，而不相似的词（如“猫”和“汽车”）则会比较远。

那为什么需要向量呢？计算机处理文字时，它们只能处理数字。因此，我们需要将文本转换为计算机可以理解的数字形式。这个向量就像是数据在数学空间中的一个“地址”，通过这个“地址”，计算机能够更容易地理解数据之间的关系。

什么是Embedding Model

在自然语言处理（NLP）中，Embedding model（嵌入模型）是一种将词语或句子转换成数字向量的技术。它实际上是将高维、离散的输入数据（例如文本、图像、声音等）转换成低维、连续的向量表示的过程。Embedding Model 就像是给每个词或句子分配一个独特的“指纹”，这个“指纹”能够在数学空间中表示这个词或句子的含义。这种模型将每个词语或句子转换成一个固定长度的数字向量。通过这种方式，计算机可以对文本进行数学计算，比如比较词语的相似性、分析句子的意义等。

Embedding Model的作用

在RAG（Retrieval-Augmented Generation）引擎中，Embedding model扮演着至关重要的角色，它用于将文本转换为向量表示，以便进行高效的信息检索和文本生成。以下是Embedding model 在RAG引擎中的具体作用和示例：

1. 文本向量化：

- 作用：将用户的问题和大规模文档库中的文本转换为向量表示。

- 举例：在RAG引擎中，用户输入一个问题，如“如何制作意大利面？”，Embedding model会将这个问题转换为一个高维向量。

2. 信息检索：

- 作用：使用用户的查询向量在文档库的向量表示中检索最相似的文档。

- 举例：RAG引擎会计算用户问题向量与文档库中每个文档向量的相似度，然后返回最相关的文档，这些文档可能包含制作意大利面的步骤。

3. 上下文融合：

- 作用：将检索到的文档与用户的问题结合，形成一个新的上下文，用于生成回答。

- 举例：检索到的关于意大利面的文档会被Embedding model转换为向量，并与问题向量一起作为上下文输入到生成模型中。

4. 生成回答：

- 作用：利用融合了检索文档的上下文，生成模型生成一个连贯、准确的回答。

- 举例：RAG引擎结合用户的问题和检索到的文档，生成一个详细的意大利面制作指南作为回答。

5. 优化检索质量：

- 作用：通过微调Embedding model，提高检索的相关性和准确性。

- 举例：如果RAG引擎在特定领域（如医学或法律）中使用，可以通过领域特定的数据对Embedding模型进行微调，以提高检索的质量。

6. 多语言支持：

- 作用：在多语言环境中，Embedding model可以处理和理解不同语言的文本。

- 举例：如果用户用中文提问，而文档库包含英语内容，Embedding model需要能够处理两种语言的文本，并将它们转换为统一的向量空间，以便进行有效的检索。

7. 处理长文本：

- 作用：将长文本分割成多个片段，并为每个片段生成Embedding，以便在RAG引擎中进行检索。

- 举例：对于长篇文章或报告，Embedding model可以将其分割成多个部分，每个部分都生成一个向量，这样可以在不损失太多语义信息的情况下提高检索效率。

通过以上几点，Embedding mode 在RAG引擎中提供了一个桥梁，连接了用户查询和大量文本数据，使得信息检索和文本生成成为可能。如下图所示，Embedding mode正处于整个RAG系统的中心位置。

RAG引擎中的工作流

以下是一个RAG引擎中工作流的示意图，此流程基本与各大RAG引擎相匹配，只是各个不同的RAG引擎，其内部算法可能有所区别而已。让我们一起来看看，RAG引擎是如何工作的。

上图中的1-5步，流程说明如下：

1. 将查询传递给嵌入模型，并在语义上将查询内容表示为嵌入的查询向量。

2. 将嵌入式查询向量传递给向量数据库。

3. 检索前 k 个相关上下文 – 通过查询嵌入和我们知识库中所有嵌入块之间的距离来衡量检索结果。

4. 将查询文本和检索到的上下文文本传递给对话大模型（LLM）。

5. LLM 将使用提供的内容生成回答内容。

总结

通过以上分析，估计各位同学对RAG引擎的工作流，以及Embedding model的作用已经有所了解，明白这些基础知识后，对以后继续学习大模型的Fine-tuning，LangChain，AI Agent等方法和概念提供了莫大帮助。

--THE END--

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-04

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-03

RAG 检索优化策略：从命中率到答案质量的一套工程打法

2026-07-03

RAG 落地总翻车？全球赛事冠军架构，改造适配企业级生产

2026-07-01

提升 RAG 准确率全攻略让你的 AI 知识库真正靠谱起来！

2026-06-30

教程：如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

2026-06-30

知识库不是文件堆——我把RAG准确率从60%调到了92%

2026-06-30

本体论语义建设新思路，另类RAG来解决检索问题

2026-06-30

别把RAG当架构：Ontology（本体）才是Agent的业务世界

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

2026 年做搜索就是做 Agent Memory

2026-04-23

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

2026年知识库幻觉根治指南：从 Naive RAG 到 Agentic RAG

2026-05-14

RAG已死？不，是Grep回归了！

2026-04-30

大家都在问

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-04

谷歌发布OKF（Open Knowledge Format）规范，它与Karpathy的LLM-wiki是什么关系？

2026-06-23

RAG 的尽头，是 SQL？

2026-06-23

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw