微信扫码
添加专属顾问
 
                        我要投稿
在这个信息爆炸的时代,大型语言模型(LLM)正在成为我们获取、处理和理解信息的重要工具。然而,直接将网页内容输入到LLM中存在诸多挑战,如网页结构复杂、加载缓慢等问题。
今天开源君给大家介绍一个非常酷的开源项目 - Reader,可以极大改善大型语言模型(LLM)的输入质量。
Reader是一个 Jina AI 开发的专为LLM设计的创新工具,它可以将网页信息转换为LLM友好的格式,如Markdown。通过去除网页中的冗余HTML标签和代码,Reader保留了核心文本内容,使得LLM能够更容易地解析和理解网页信息。
主要功能有两个:读取和搜索。
此外,Reader还支持流模式,能够处理加载缓慢的网页,并逐步获取内容。
目前在Github上面收获了4.6K star!
本地开发的话,需要先安装 Node v18 和 Firebase CLI,然后依次执行命令
git clone [email protected]:jina-ai/reader.git
cd backend/functions
npm install
最简单的使用方法是,直接访问 Jina AI 提供的在线演示页面:https://jina.ai/reader#demo,可以立即体验 Reader 的功能而无需进行任何安装。
通过转换之后,AI回答和识别的速度,准度都大大提高。
也可以直接使用添加前缀的方法快速使用。
比如,使用读取模式,在浏览器地址栏中输入 https://r.jina.ai/,后面跟上想要转换的网页 URL。例如,要转换 Wikipedia 上关于人工智能的页面,可以访问:https://r.jina.ai/https://en.wikipedia.org/wiki/Artificial_intelligence
这样可以让 LLM 更好的提取信息
使用搜索模式,在浏览器地址栏中输入 https://s.jina.ai/,后面跟上搜索查询。例如,搜索 "2024 US presidential election",可以访问:https://s.jina.ai/Who%20will%20win%202024%20US%20presidential%20election%3F
使用 Reader API
基本用法
高级用法
如果想体验 Reader 的流式模式,可以在命令行中使用 curl 命令。
curl -H "Accept: text/event-stream" https://r.jina.ai/https://en.m.wikipedia.org/wiki/Main_Page
JSON 模式体验,使用 curl 命令设置 Accept 头为 application/json:
curl -H "Accept: application/json" https://r.jina.ai/https://en.m.wikipedia.org/wiki/Main_Page
小结一下,Reader是 Jina AI 开发的一个功能强大且易于使用的工具,它通过简化网页内容的获取和转换过程,极大地提升了 LLM 应用的效率和准确性。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-30
开源可信MCP,AICC机密计算新升级!
2025-10-30
OpenAI 开源了推理安全模型-gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b
2025-10-29
刚刚,OpenAI 再次开源!安全分类模型 gpt-oss-safeguard 准确率超越 GPT-5
2025-10-29
AI本地知识库+智能体系列:手把手教你本地部署 n8n,一键实现自动采集+智能处理!
2025-10-29
n8n如何调用最近爆火的deepseek OCR?
2025-10-29
OpenAI终于快要上市了,也直面了这23个灵魂拷问。
2025-10-29
保姆级教程:我用Coze干掉了最烦的周报
2025-10-29
维基百科,终结了!马斯克开源版上线,用AI重写「真相」
 
            2025-08-20
2025-09-07
2025-08-05
2025-08-20
2025-08-26
2025-08-22
2025-09-06
2025-08-06
2025-10-20
2025-08-22
2025-10-29
2025-10-28
2025-10-13
2025-09-29
2025-09-17
2025-09-09
2025-09-08
2025-09-07