微信扫码
添加专属顾问
我要投稿
开源项目PixelRAG带来知识库搜索的视觉革命,让AI像人一样“看”页面,彻底解决传统文本解析丢失表格、图表等关键信息的问题。核心内容: 1. 像素级原生搜索的核心原理:渲染截图替代文本解析 2. 处理复杂视觉文档的独特优势,保留表格、图表、布局 3. 完整的技术栈与生态支持,从截图到检索的全流程
做知识库都要用到RAG,之前的做法是先把网页、PDF、文档解析成文本,再切块、向量化、检索、交给大模型回答。
这个流程对纯文本内容很有效,但一旦遇到表格、图表、版式、信息图、复杂网页布局,就很容易丢失关键信息。
今天给大家推荐一个像素级原生搜索的RAG。
这项目思路很有趣,既然人类理解网页时是看页面,为什么AI检索一定要先把页面拆成文本,完全可以把网页和文档渲染成截图,再基于图像内容进行检索,让模型保留页面原本的视觉结构。
项目简介
PixelRAG是一个像素原生的开源视觉RAG项目,把网页、PDF、图片等文档渲染成截图切片,并直接对这些图像建立向量索引和检索,从而让大模型能够利用表格、图表、布局、信息图等传统文本解析容易丢失的信息来回答问题。
不仅按文本内容搜索文档,还能按文档看起来是什么样来搜索。
DEMO
为了展示像素原生检索的威力,官方做了个很牛的演示,来证明这套方案行得通。
直接截了2800多万张维基百科的图片。
比如搜元素周期表。
只要2秒就完成了。
说这个方案更好,但不一定是更便宜,因为这2800w张图片的向量化不是我去做的,我也不知道成本如何。
传统RAG的那种信息、样式丢失的感觉真的很不好。
现在直接就可以搜出来有样式的内容,就非常好。
如果要对数据进行处理,就用视觉模型来做下一步了。
功能特点
1. 以截图替代文本解析
PixelRAG的核心不是先把网页HTML或PDF解析成纯文本,而是把页面渲染成截图切片。这样可以最大程度保留页面原始的视觉信息,比如表格结构、图表位置、页面布局、字号层级和信息密度。
2. 更适合处理复杂视觉文档
传统RAG在处理复杂表格、图表、论文截图、仪表盘、网页报告时,经常会因为解析失败或结构丢失而答错。PixelRAG通过视觉检索,让模型看到更接近人眼观察到的页面内容,适合处理视觉结构强的知识材料。
3. 支持网页、PDF和图片等多种输入
项目提供pixelshot命令,可以把网页、PDF、本地文件渲染成截图tiles。用户可以对单个网页截图,也可以把本地文档批量转成可检索的视觉数据。
4. 内置完整检索流水线
PixelRAG不只是截图工具,还提供从文档渲染、切块、嵌入、构建 FAISS 索引到启动搜索API的完整流程。
5. 使用视觉嵌入模型进行检索
使用经过网页截图数据LoRA微调的Qwen3-VL-Embedding模型,把页面截图嵌入到可检索的向量空间中。相比普通文本向量,这种方式更适合检索页面里的视觉内容。
6. 可作为 Claude Code 插件使用
PixelRAG提供pixelbrowse插件,让Claude Code可以通过截图方式查看网页,不是只读取网页HTML。这样AI就可以更好地理解网页里的图表、表格和页面排版。
项目链接
https://github.com/StarTrail-org/PixelRAG53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-25
1.5K Star!网页提取神器 webclaw:让 AI 精准抓取网页核心内容!
2026-06-25
聊一聊检索即推理:基于LLM-Wiki的自演化智能体原生检索
2026-06-24
企业级 Agent 最缺的不是聪明,是"不敢编"——企查查智能体数据平台的三层反幻觉工程
2026-06-24
别再怪向量检索不行!90% RAG 检索拉胯,都是关键词提取在拖后腿
2026-06-24
别再把 RAG 当搜索框了:Bayer 这套 Agentic RAG,把上下文、反思、恢复和评测全焊进生产系统
2026-06-24
上生产GraphRAG的重活,SAG请外援解决了
2026-06-23
RAG之后,知识库开始自己长大
2026-06-23
AI 知识库开始分叉:LLM Wiki 和 GBrain 真正的差别
2026-04-06
2026-04-27
2026-04-02
2026-04-23
2026-03-31
2026-04-20
2026-04-09
2026-04-12
2026-04-22
2026-04-10
2026-06-23
2026-06-23
2026-06-15
2026-06-10
2026-06-10
2026-05-20
2026-05-18
2026-05-11