2026年6月11日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

RAG检索:注定下沉为检索基础设施_tag2

发布日期:2026-06-06 11:09:33 浏览次数: 1529
作者:NanoAgent

微信搜一搜,关注“NanoAgent”

推荐语

RAG正从应用内部流程演变为可复用的基础设施,为AI系统提供持续、动态的检索能力。

核心内容:
1. Native RAG的局限性及独立检索层的优势
2. Agentic RAG中检索作为动态工具的工作机制
3. RAG演变为共享基础设施的核心趋势与价值

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

RAG 注定下沉为检索基础设施

Anthropic 的 MCP 将检索能力封装为 Agent 可调用的工具;Google 也在 Gemini Agent 体系中通过 MCP 提供检索服务,使检索能力逐渐从应用内部流程演变为独立的基础设施层。

⚡ 核心变化

检索不再只是生成前的一次固定步骤,而是逐渐成为 AI 系统中可复用、可持续运行、可被 Agent 动态调用的基础能力。

Native RAG

Native RAG 在单个应用内部以一次性 Pipeline 的方式运行。知识库需要完成分块、向量化并写入向量数据库。查询时,用户问题会触发向量检索,检索到的相关内容被发送给 LLM,用于生成最终回复。

当答案主要来自变化较少的知识库时,Native RAG 能够取得不错的效果。但随着数据规模和应用数量增加,性能下降明显:

数据容易过时。向量索引反映的是数据入库时的状态,当源文档发生变化后,需要重新执行数据同步和向量化流程才能更新索引。
难以复用。检索逻辑通常与应用深度耦合,新的应用或 Agent 如果需要访问相同知识库,往往需要重复构建相似的分块、嵌入和检索流程。

独立数据检索层

一种改进方式是将检索能力从应用内部抽离出来,构建独立的数据检索层(Retrieval Layer)。在这种架构下,知识入库与查询过程被解耦,数据可以持续同步和更新。

在知识入库阶段,连接器从不同数据源提取内容,完成身份认证、数据采集、实体切分、向量化和索引构建,同时保留元数据、来源信息和版本信息。

同步过程采用增量更新机制,仅处理发生变化的数据,避免对未修改内容重复嵌入。

在查询阶段,请求经过查询扩展、混合检索(向量检索 + 关键词检索)、重排序等流程,最终返回带有来源归属的信息。

💡 复用的关键

检索层不再属于某个具体应用,而是作为独立服务通过 API 或 MCP 对外提供能力,聊天机器人、Agent 和工作流系统都可以共享同一套索引和检索能力。


Agentic RAG

在 Agentic RAG 中,Agent 会根据当前任务主动判断需要哪些上下文信息,并将检索作为工具动态调用。

Agent 可以发起检索、阅读结果、评估信息是否充分,并根据需要调整查询条件再次搜索,形成“推理 → 检索 → 推理 → 再检索”的循环过程。

此时,Agent 的搜索能力与传统 RAG 应用共享同一条检索链路和同一个知识库。检索不再只是生成前的一次固定步骤,而成为 Agent 推理过程中的基础工具能力。此时,RAG 与 Agent 不再是彼此独立的系统,而是共享同一套检索基础设施。


写在最后

RAG 的演变并不是让检索变得越来越复杂,而是让检索从一次性 Pipeline 演变为可持续运行、可复用、可被 Agent 动态调用的基础设施能力。检索将像 Web Search 和 API 一样,成为 AI 系统的标准工具。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询