LangChain和qwen实现RAG增强检索

发布日期：2024-04-19 07:39:30 浏览次数： 5563

作者：河指令

微信搜一搜，关注“河指令”

LangChain和qwen实现RAG增强检索

本教程技术的选型为langchain+通义千问（qwen)，使用的通义千问提供的API，为啥不选择本地部署开源LLM模型的？目前只是处在探索RAG项目应用阶段，再加上本地电脑配置有限，只能跑小型的模型，效果不是很好，目前调用有免费额度，所以最终选择了它。

在开始之前，我们先花几分钟了解一下什么是RAG？

RAG 是一种用附加数据来增强大语言模型的技术。RAG技术利用检索模块从大型语料库中检索相关信息，可以更准确地获取到与问题相关的内容，从而提高了问答系统的准确性。与传统的基于生成的系统相比，RAG技术能够更好地理解用户的问题，并给出更准确、全面的答案。

RAG工作流程分为以下步骤

1.数据获取

加载各种类型的数据，如文本文件、PDF、网站数据、数据库或者是接口API。

2.数据预处理和清理

获取到数据后，针对不同格式的数据进行清理，剔除不必要的数据。

3.分块

将数据分成更小的块，对应检索数据比较有用，大块的数据更难搜索并且不适合上下文检索有限的大语言模型。

4.词嵌入

分块后，需要将文本转换成LLM可以理解的数字表示形式（向量嵌入）。

5.矢量数据库

存储转换后的向量数据，方便我们对更多的文档进行检索

6.检索相关内容

根据用户的提问，先从矢量数据库中找到相似的内容。

7.LLM生成

通过检索到相似的内容，把它和用户的问题一起传递给LLM，以便LLM生成更准确的内容。

准备内容：

通义千问API-KEY（必须）：申请很简单的，注册账号后进行认证，就可以开通了，几分钟搞定。

`langchain`的安装

# pip安装
pip install langchain
# 如果你用的是Conda，也可以通过以下命令
# conda install langchain -c conda-forge

# pdf文档的读取和ocr识别
pip install pypdf rapidocr-onnxruntime

pip install --upgrade --quiet  dashscope

引入相关包

from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import DashScopeEmbeddings

from langchain_community.llms import Tongyi
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
import os

数据的准备

这步主要是把数据读取出来，然后将文档拆分成小块。

chunk_size：指定了每个拆分的片段的长度为1000个字符。

chunk_overlap：指定了每个拆分的片段之间的重叠部分为200个字符。

add_start_index：指定了是否在每个拆分的片段中添加起始索引。如果设置为 True，则在每个拆分的片段的开头添加一个起始索引。

pdf_loader = PyPDFLoader('test.pdf', extract_images=True)
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000, chunk_overlap=200, add_start_index=True
)
pages = pdf_loader.load_and_split()

词嵌入并保存到向量数据库

使用阿里的灵积模型服务的文本嵌入模型，把拆分成小块的数据进行向量化。然后对数据进行查询，返回两个最相似的数据块，最后保存到向量数据库，下次我们就可以加载该文件使用了。

embeddings = DashScopeEmbeddings(
    model="text-embedding-v1", dashscope_api_key="你申请的千问API-KEY"
)

faiss_index = FAISS.from_documents(all_splits, embeddings)
# 搜索我们的文档数据，返回两个最相似的

docs = faiss_index.similarity_search("本季度排名第一的电视剧是啥?", k=2)

# 打印输入
for doc in docs:
    print(str(doc.metadata["page"]) + ":", doc.page_content[:300])

# 保存到向量数据库中
faiss_index.save_local('testpdf.faiss')

调用大语言模型生成结果

先加载向量库文件，然后将向量数据转换成 Retriever 类，最后构建通义千问的大语言模型服务对象。


faiss_index = FAISS.load_local('testpdf.faiss', embeddings, allow_dangerous_deserialization=True)

retriever = faiss_index.as_retriever(search_kwargs={"k": 6})

os.environ["DASHSCOPE_API_KEY"] = "你申请的千问API-KEY"

llm = Tongyi()

开始构建模板

通过上下文+提问的方式，生成模板。

template = """利用以下上下文回答最后的问题。如果不知道答案，就说不知道，不要试图编造答案。

{context}

Question: {question}

Helpful Answer:"""
custom_rag_prompt = PromptTemplate.from_template(template)

rag_chain = (
  {"context": retriever, "question": RunnablePassthrough()}
    | custom_rag_prompt
    | llm
    | StrOutputParser()
)

进行提问

rag_chain.invoke("本季度排名第一的电视剧是啥？")

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-30

本体论语义建设新思路，另类RAG来解决检索问题

2026-06-30

别把RAG当架构：Ontology（本体）才是Agent的业务世界

2026-06-29

PixelRAG：伯克利团队颠覆传统 RAG，用截图代替文本检索! 28 天狂揽 3000+ Star！

2026-06-29

腾讯WeKnora开源详解（三）：检索引擎与生态集成

2026-06-29

腾讯开源WeKnora详解（二）：知识库与对话核心能力

2026-06-29

RAG又被绕开了，MIT用MEMO给AI外挂记忆脑

2026-06-25

5.2k星星爆火开源！你的知识库迎来了史诗级更新，「像素级原生搜索」来了

2026-06-25

1.5K Star！网页提取神器 webclaw：让 AI 精准抓取网页核心内容！

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

2026 年做搜索就是做 Agent Memory

2026-04-23

RAG进化了，深扒Claude Code源码中RAG高级技巧

2026-04-02

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

2026年知识库幻觉根治指南：从 Naive RAG 到 Agentic RAG

2026-05-14

大家都在问

谷歌发布OKF（Open Knowledge Format）规范，它与Karpathy的LLM-wiki是什么关系？

2026-06-23

RAG 的尽头，是 SQL？

2026-06-23

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

到底是谁会相信RAG已死啊？

2026-05-11

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

LangChain和qwen实现RAG增强检索

LangChain和qwen实现RAG增强检索

准备内容：

langchain的安装

引入相关包

数据的准备

词嵌入并保存到向量数据库

调用大语言模型生成结果

开始构建模板

进行提问

`langchain`的安装