免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


RAGFlow:让大模型真正读懂公司所有文档的开源 RAG 引擎

发布日期:2025-09-03 05:29:07 浏览次数: 1555
作者:代码蜂巢x

微信搜一搜,关注“代码蜂巢x”

推荐语

RAGFlow开源引擎让企业文档处理变得简单高效,支持20+格式解析与精准溯源引用,彻底解决大模型幻觉问题。

核心内容:
1. RAGFlow的核心功能:深度文档解析、模板化切片、多路召回与重排
2. 技术亮点:自研LayoutLM模型、高性能向量存储、沙箱安全机制
3. 部署优势:一键Docker部署,支持多种商业/开源模型即配即用

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

把 Word、PPT、扫描件、网页统统变成“可信答案”与“可溯源引用”


项目概述

RAGFlow 是 infiniflow 团队开源的一款 基于深度文档理解的 RAG(Retrieval-Augmented Generation)引擎
它不仅能把任何格式的企业知识“切片”后喂给大模型,还能让大模型在回答时给出精确的段落级引用,真正做到 “Quality in, quality out”

RAGFlow = 深度文档解析 + 模板化切片 + 多路召回 & 重排 + 引用可视化 + 一键 Docker 部署


问题背景

  • • 幻觉顽疾:企业级场景对答案准确性要求极高,但大模型天生“胡说八道”。
  • • 格式噩梦:合同、标书、财报、扫描件、网页……格式千奇百怪,传统解析器频频翻车。
  • • 部署臃肿:开源方案动辄十几个步骤,依赖复杂,运维想哭。

RAGFlow 的出现,就是要把这些问题一次性打包解决。


功能亮点

特性
一句话卖点
📄 深度文档理解
支持 Word / PPT / Excel / PDF / 扫描图片 / 网页等 20+ 格式,表格、公式、图文混排都能精准还原。
🍱 模板化切片
提供 可视化模板市场,可拖拽定义“按标题、按表格、按段落”等切片策略,零代码也能调优。
🌱 减少幻觉
答案附带 原文定位高亮,支持一键跳转原文,溯源到页码、段落、表格单元格。
🍔 异构数据源
同一份知识库可混合上传本地文件、Web 抓取、S3、Notion、Confluence 等。
🛀 自动化工作流
内置 Agent 代码执行器MCP(Multi-Chain Prompting)跨语言查询,复杂任务也能一条指令跑完。
🚀 一键部署
Docker Compose 一条命令拉起,CPU/GPU 双模式可选;x86 预置镜像 2 GB(slim)/9 GB(full)。

技术细节

  • • 解析层 DeepDoc:自研 LayoutLM 系列模型,在财报/论文/标书中 F1 > 95%
  • • 向量存储:默认 Elasticsearch,可一键切换高性能引擎 Infinity(百万级 QPS,毫秒延迟)。
  • • 召回 + 重排:多路向量 & 全文混合召回 → Cross-Encoder 重排 → Top-k 段落送入 LLM。
  • • 沙箱安全:代码执行器基于 gVisor 隔离,防止恶意脚本。
  • • 模型接入:已支持 OpenAI GPT-5、Kimi K2、Grok-4 等 20+ 商业/开源模型,配置即用。

安装与使用

系统要求

  • • CPU ≥ 4 核 / RAM ≥ 16 GB / 磁盘 ≥ 50 GB
  • • Docker ≥ 24.0 & Docker Compose ≥ v2.26.1

30 秒启动

# 1. 一键克隆
git clone https://github.com/infiniflow/ragflow.git && cd ragflow/docker

# 2. 调整系统参数(仅需一次)
sudo sysctl -w vm.max_map_count=262144

# 3. CPU 版启动(GPU 版把 yml 换成 -gpu)
docker compose up -d

浏览器访问 http://<服务器IP>,注册账号,即可拖拽上传第一批文档。

首次登录后,在「系统设置 → LLM 供应商」填入你的 OpenAI / Kimi API Key,即可立刻问答。


应用案例

  • • 某头部券商:把 2000 份 IPO 招股说明书接入 RAGFlow,问答准确率从 62% 提升到 93%,尽调时间缩短 70%。
  • • 律所知识库:扫描合同 + 法律条文混合检索,律师可在 3 秒内定位到条款依据。
  • • 高校科研组:将论文 & 实验笔记向量化,实现“跨语言提问 + 图表级溯源”,科研效率提升 2 倍。
  • • 在线 Demo:官方提供 demo.ragflow.io[1](免登录即可体验)。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询