我要投稿

Embedding 与 Rerank 模型

发布日期：2025-08-18 19:20:18 浏览次数： 1765

作者：小海\x26amp;Chain语

微信搜一搜，关注“小海\x26amp;Chain语”

1.引言

在RAG系统中，常见的两种优化方式包括：

混合检索（Hybrid Retrieval）：结合 dense embedding 和 sparse embedding 的检索方式；
两阶段排序（Two-Stage Ranking）：先通过 embedding 模型进行初步召回（粗排），再通过 rerank 模型进行精排。

这引出两个关键问题：

Dense Embedding 与 Sparse Embedding 有何本质区别？它们各自适用于哪些检索场景？
Embedding 模型与 Rerank 模型在结构和能力上有何不同？各自适合用于系统的哪一阶段？

最近，qwen3-embedding模型发布后，备受关注，那llm-emb和上面独立-emb又有什么不同呢？

2.Dense-Embedding 与Sparse-Embedding

Sparse-Embedding: 基于词频统计的关键词匹配(代表算法如 BM25 和 TF-IDF)，利用词频（TF）和逆文档频率（IDF）计算词的重要性。最终文本被表示为高维稀疏向量，非零元素对应出现的词项。

适用场景：关键词的精确匹配

Dense-Embedding: 基于深度学习模型（如 BERT）将文本编码为低维稠密向量，捕捉语义信息。通过余弦、L2等向量的相似度计算获取相关向量的重要性。最终文本被表示为低维稀疏向量。

适用场景：识别同义词和语义相近的表达

3.Embedding 与 Rerank

Embedding-model和Rerank-model分别采用了两种模型架构：Bi-Encoders 和Cross-Encoder。

	Bi-Encoders	Cross-Encoder
架构	独立编码器: 共享参数	交叉编码器：单编码器处理拼接文本，cls标记生成最终结果
处理方式	查询和文档分别编码，再对编码结果进行相似度计算	查询和文档拼接后输入交叉编码器进行联合编码，直接输出相似度分数
交互性	向量空间中交互	文本间的细粒度交互
计算效率	高	低(需要随时计算，随数据量呈线性增长)
训练数据需求	需大量负样本(对比学习)	直接用正负样本对
训练策略	损失函数：对比损失（InfoNCE）、三元组损失。训练目标：拉近正样本对的向量距离，推远负样本对。数据增强：依赖负采样策略（如困难负样本挖掘）	损失函数：交叉熵（分类任务）、均方误差（回归任务）。训练目标：直接预测相似度分数或类别标签。输入格式：拼接文本

4.llm-Embedding 与 Embedding-model

llm-embedding：其训练是和所有的transformer block一起训练的，最终的优化目标是为了提高下一个token的准确率，其输出的向量内含“上下文理解”和“未来指向性”的信息浓度，这是embedding模型所不具备的。

Embedding模型：采用对比学习进行训练，文本对，存在正负样本。损失函数：在向量空间中，拉近正例对的向量距离，推远负例对的向量距离。生成的向量在衡量句子间“意思是否相近”这个问题上表现得极其出色，是专门为语义搜索、聚类、RAG（检索增强生成）等任务量身定做的。

qwen3-emb采用decoder-only架构实现，其具备instruct能力，通过给到适当的prompt 去“调节任务逻辑”，让同一个模型能适配不同类型的召回或匹配任务。(兴奋兴奋) 举例："岗位召回简历的匹配场景"

在emb时添加指令"Given a resume and a job description, determine whether the candidate strictly meets the job requirements"即可切换该场景

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-12-19

刚刚，OpenAI最强编程大模型发布！

2025-12-19

OpenAI最强代码模型GPT-5.2-Codex上线

2025-12-19

AI架构师的诞生：AI+传统DDD模式 = 实现开发效率提升75%

2025-12-19

Anthropic 指路，Letta 破局：Agent 下半场的关键词是 Skills

2025-12-19

突发｜ChatGPT 版应用商店正式上线

2025-12-18

端侧AI革命！Android App上可直接集成Gemini大模型了！

2025-12-18

突发！ChatGPT版应用商店正式发布，第三方开发者新入口！

2025-12-18

实测豆包1.8后，我终于明白字节为什么要推豆包手机了。

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

马斯克 Grok imagine 完整使用指南：工具、案例、提示词，看这一篇就够了！

2025-10-26

实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码）

2025-10-02

RagFLow v0.20.X全面解析！双向MCP、Agentic智能体...这次真的起飞了！（附长图）

2025-09-29

一文速览OpenAI Dev Day 2025，下半年开始大洗牌

2025-10-07

Claude Sonnet4.5发布，号称世界最强模型，超越gpt-5-codex

2025-09-30

我挖到Gemini 3.0 Pro十大隐藏玩法，做网页已经落后N个版本了

2025-11-19

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

2025-10-20

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码)

2025-11-13

Sora 2带来3个颠覆性创新，这个行业或将被彻底重构

2025-10-02

从spec-kit到OpenSpec：规格驱动开发如何解决项目迭代痛点？

2025-10-18

大家都在问

Prompt是与LLM对话的唯一方式：如何给大模型装上能指挥“手脚”的脑子？

2025-12-16

200k Tokens 的上下文真的够用吗？

2025-12-15

巨头翻身！谷歌全新AI浏览器Disco问世，PC版灵光？

2025-12-14

2025年，企业级AI的主战场在哪里？

2025-12-12

GPT 5.2的长上下文厉害了，但是写文真的强吗？

2025-12-12

涌现观点｜AI 开发的"App Store 时刻"：为什么你应该停止构建 Agent？

2025-12-11

Human In the Loop竟然可以是个MCP?

2025-12-09

AI会消灭搜索吗？

2025-12-08

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： [email protected]

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部