RAG 系统开发 01：使用 rig 调用 ollama 的模型

发布日期：2025-02-15 13:34:00 浏览次数： 3024

作者：羊八井花园

微信搜一搜，关注“羊八井花园”

这是个系列文章，将介绍基于 Rust 语言生态来开发一个 RAG 系统。本文是文章的第一篇，主要介绍如何使用 rig^[1] 来调用 ollama 模型。

项目准备

设置 Rust 开发环境

推荐使用 RsProxy 来设置 Rust 开发环境，步骤非常的简单：

1. 设置 Rustup 镜像，修改配置 ~/.zshrc 或 ~/.bashrc

export RUSTUP_DIST_SERVER="https://rsproxy.cn"
export RUSTUP_UPDATE_ROOT="https://rsproxy.cn/rustup"

2. 安装 Rust（请先完成步骤一的环境变量导入并 source rc 文件或重启终端生效）

curl --proto '=https' --tlsv1.2 -sSf https://rsproxy.cn/rustup-init.sh | sh

3. 设置 crates.io 镜像，修改配置 ~/.cargo/config.toml：

[source.crates-io]
replace-with = 'rsproxy-sparse'
[source.rsproxy]
registry = "https://rsproxy.cn/crates.io-index"
[source.rsproxy-sparse]
registry = "sparse+https://rsproxy.cn/index/"
[registries.rsproxy]
index = "https://rsproxy.cn/crates.io-index"
[net]
git-fetch-with-cli = true

安装 ollama 并下载模型

详细安装及使用可我之前文章：本地运行 deepseek-r1，LLM 安装简明指南

创建项目

开发工具建议使用 VSCode，并安装插件 rust-analyzer。在命令行终端执行以下命令创建 Rust 项目并添加必要的 crates：

cargo new fusion-rag
cd fusion-rag
cargo add rig-core --features derive
cargo add tokio --features full

现在项目已经建好，可以通过 VSCode 打开

code .

执行默认的 main.rs 文件，可以运行成功。

使用 rig-core

通过 openai 兼容模式访问 ollama API

编辑 main.rs 文件，修改为以下代码：

use rig::{completion::Prompt, providers};

#[tokio::main]
asyncfnmain() ->Result<(), Box<dyn core::error::Error>> {
    letclient = providers::openai::Client::from_url("ollama", "http://localhost:11434/v1");
    letv1 = client
        .agent("qwen2.5:latest") // .agent("deepseek-r1:latest")
        // preamble 用于设置对话的 `system` 部分，通常设置为聊天上下文的提示语
        .preamble("你人工智能助手，你更擅长逻辑推理以及中文和英文的对话。")
        .build();

    // prompt 用于设置对话的 `user` 部分，用于提供每次对话的内容
    letresponse = v1.prompt("1.1 和 1.11 哪个大？").await?;
    println!("回答: {}", response);
    Ok(())
}

运行程序，可获得如下输出：

回答: 在数值比较中，1.1 和 1.11 进行比较时，可以看出 1.11 比 1.1 要大。

数学上具体的比较过程如下：

- 首先比较小数点后的第一位数字。在这个例子中都是“1”，所以这一位是相等的。
- 然后继续比较下一位，也就是第二个小数点后的数字。对于 1.1 而言，这一步之后没有数字，所以我们假定为 0（在实际中通常会以零补齐），因此可以认为 1.1 相当于 1.10。这时候我们可以看到在“1.10”和“1.11”之间进行比较，“1.11”的结果显然比“1.10”大。

所以，结论是：1.11 大于 1.1。

提示：使用 deepseek-r1:latest 模型可以获得更详细的回答（包含思考过程），但需要的资源更多且输出的内容也会更长。读者可以自行选择适合自己的模型。

通过嵌入模型实现 RAG

nomic-embed-text 模型

nomic-embed-text 是专门用于生成文本嵌入（text embeddings）的模型。文本嵌入是将文本数据转换为向量表示的过程，这些向量能够捕捉文本的语义信息，在很多自然语言处理任务中都非常有用，例如信息检索（找到与查询文本语义相近的文档）、文本分类、聚类分析等。可通过以下命令下载此模型。

ollama pull nomic-embed-text

添加 crates 依赖

cargo add serde

实现 RAG 逻辑

编辑 main.rs 文件，更新为以下代码：

use rig::{
    completion::Prompt, embeddings::EmbeddingsBuilder, providers,
    vector_store::in_memory_store::InMemoryVectorStore, Embed,
};
use serde::Serialize;

// 需要进行 RAG 处理的数据。需要对 `definitions` 字段执行向量搜索，
// 因此我们为 `WordDefinition` 标记 `#[embed]` 宏以派生 `Embed` trait。
#[derive(Embed, Serialize, Clone, Debug, Eq, PartialEq, Default)]
structWordDefinition {
    id: String,
    word: String,
    #[embed]
    definitions: Vec<String>,
}

#[tokio::main]
asyncfnmain() ->Result<(), Box<dyn core::error::Error>> {
    const MODEL_NAME: &str = "qwen2.5";
    const EMBEDDING_MODEL: &str = "nomic-embed-text";
    letclient = providers::openai::Client::from_url("ollama", "http://localhost:11434/v1");
    letembedding_model = client.embedding_model(EMBEDDING_MODEL);

    // 使用指定的嵌入模型为所有文档的定义生成嵌入向量
    letembeddings = EmbeddingsBuilder::new(embedding_model.clone())
        .documents(vec![
            WordDefinition {
                id: "doc0".to_string(),
                word: "flurbo".to_string(),
                definitions: vec![
                    "1. *flurbo* （名词）：flurbo是一种生活在寒冷行星上的绿色外星人。".to_string(),
                    "2. *flurbo* （名词）：一种虚构的数字货币，起源于动画系列《瑞克和莫蒂》。".to_string()
                ]
            },
            WordDefinition {
                id: "doc1".to_string(),
                word: "glarb glarb".to_string(),
                definitions: vec![
                    "1. *glarb glarb* （名词）：glarb glarb是次郎星球居民祖先用来耕种土地的古老工具。".to_string(),
                    "2. *glarb glarb* （名词）：一种虚构的生物，发现于仙女座星系Glibbo星球遥远的沼泽地。".to_string()
                ]
            },
        ])?
        .build()
        .await?;

    // 使用这些嵌入创建向量存储
    letvector_store = InMemoryVectorStore::from_documents(embeddings);

    // 创建向量存储索引
    letindex = vector_store.index(embedding_model);

    letrag_agent = client
        .agent(MODEL_NAME)
        .preamble(
            "您是这里的词典助理，帮助用户理解单词的含义。
            您将在下面找到其他可能有用的非标准单词定义。",
        )
        .dynamic_context(1, index)
        .build();

    // 提示并打印响应
    letresponse = rag_agent.prompt("\"glarb glarb\" 是什么意思？").await?;
    println!("{}", response);

    Ok(())
}

先运行程序看看效果，可获得如下输出：

$ cargo run -q
在给出的定义中，“glarb glarb”有以下两种解释：

1. **名词**: 这是次郎星球居民祖先用来耕种土地的古老工具。
2. **名词**: 一种虚构的生物，发现于仙女座星系Glibbo星球遥远的沼泽地。

请注意，这是基于提供的文档定义，“glarb glarb”可能是两个不同的名词，具有不同的含义和背景。

当我们注释掉 .dynamic_context(1, index) 一行时再次运行，输出结果如下：

$ cargo run -q
很抱歉，“glarb glarb”并不是一个已知的词语或表达方式，在标准语言中没有明确的意义。这可能是误输入或者是某种特定情境下的自创语句。具体含义需要更多上下文信息来确定。如果您是在某个游戏中、书中或是特殊社群里看到这个短语，可能需要参照该环境中的规则或解释。

可以看到，我们在使用 .dynamic_context(1, index) 函数后，这个函数会根据输入的提示，从向量存储中搜索最相似的文档，然后将这些文档添加到提示中，从而实现 RAG（Retrieval Augmented Generation）的效果。

小结

本文简单的介绍了如何使用 rig-core 库来使用 Ollama 的本地模型实现 RAG。这是一个基本的示例，实际应用中可能需要根据需求进行一些调整和扩展。后面会有更详细的介绍和示例，比如：文档（PDF、Word、excel、PPT）解析、数据持久化存储、……敬请期待。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-05

AI 知识库为什么总答不准？不是模型笨，是资料没整理好

2026-07-05

AI知识库RAG演进：上一代解决「找得到」，下一代解决「记得住、连得起、信得过」

2026-07-04

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-03

RAG 检索优化策略：从命中率到答案质量的一套工程打法

2026-07-03

RAG 落地总翻车？全球赛事冠军架构，改造适配企业级生产

2026-07-01

提升 RAG 准确率全攻略让你的 AI 知识库真正靠谱起来！

2026-06-30

教程：如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

2026-06-30

知识库不是文件堆——我把RAG准确率从60%调到了92%

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

2026 年做搜索就是做 Agent Memory

2026-04-23

Codeindex · 让大模型更好地理解你的代码

2026-04-20

阿里云百炼「记忆库」正式上线，让龙虾真正记住你！

2026-04-09

YC CEO 的 AI 记住了 3000 个人

2026-04-12

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI 答疑助手优化实践：从 RAG 到 LightRAG 的全链路升级

2026-04-10

2026年知识库幻觉根治指南：从 Naive RAG 到 Agentic RAG

2026-05-14

RAG已死？不，是Grep回归了！

2026-04-30

Mem0 深度解析：智能记忆层的架构原理

2026-04-27

大家都在问

大模型支持的上下文已超 1M, RAG 是不是没有意义了?

2026-07-04

谷歌发布OKF（Open Knowledge Format）规范，它与Karpathy的LLM-wiki是什么关系？

2026-06-23

RAG 的尽头，是 SQL？

2026-06-23

RAG运维如何用好Loop Engineering？Milvus 3.0 对它有什么价值？

2026-06-15

如何构建一个更“好”的知识库？

2026-06-10

企业 RAG 知识库落地，应如何设计实现？

2026-06-10

AIOps探索：给不能联网的客户做一个AI运维助手到底有多难？

2026-05-20

有多少人把Agent与RAG的检索策略，简化成了 if-else？

2026-05-18

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw