我要投稿

Deep Research开源产品的本地化部署

发布日期：2025-07-24 10:04:22 浏览次数： 2312

作者：正点驿站

微信搜一搜，关注“正点驿站”

Deep Research是什么？

Deep Research技术主要是用于生成全面的报告。对于以往可能需要花费数天或者数周的时间，进行信息检索、搜集、理解、加工，并最终撰写报告的研究或分析领域，使用大模型的Deep Research技术可能在十几分钟就能得到结果。

在这个领域，会去掉对大模型执行时间的限制，允许大模型花十几分钟或更多的时间来进行充分的信息搜集和报告撰写。

使用体验

我尝试了豆包的深入研究功能，让它帮我生成关于Deep Research的研究报告。它先是跟我确认了几个细节，然后开始在网上搜集资料并分析，最后撰写报告。

可以在下面的链接，查看完整的对话：

https://www.doubao.com/thread/w05cd8672d15ad043

可以在这里看到它的工作过程，包括搜集资料、分析、根据已经掌握的资料动态调整下一步要搜集的内容。最后它会先撰写一份markdown格式的报告，再撰写一份更加美观的html格式的报告，两份报告都可以直接下载。

我曾将豆包的深入研究功能用于我的工作当中，尤其是在一个陌生的领域，起到了一个快速带我入门的效果。

除了豆包之外，我还试图尝试ChatGPT的Deep Research功能，免费用户每个月可以使用5次，但是我没有真正触发它去做Deep Research，它只是基于已经掌握的知识来生成报告。

相关开源产品

考虑到我们在工作当中确实有研究&分析的场景，尤其可能需要结合私有化数据，所以也去进一步探索了相关的开源实现，打算进行本地化部署。

做这个事情的一般前提是对数据隐私和数据安全的要求，所以一定需要有本地化的大模型服务。如果是对完全公开的内容做研究和分析，其实直接使用类似于豆包的深入研究就可以了。

目前，我已经观察到的开源项目如下：

khoj-ai/khoj 30.5k AGPL-3.0 license 商业不友好
https://github.com/khoj-ai/khoj
assafelovic/gpt-researcher 22.3k Apache-2.0 license 商业友好
https://github.com/assafelovic/gpt-researcher
dzhng/deep-research 17k MIT license 商业友好
https://github.com/dzhng/deep-research
bytedance/deer-flow 15.2k MIT license 商业友好
https://github.com/bytedance/deer-flow
nickscamara/open-deep-research 5.8k
https://github.com/nickscamara/open-deep-research
jina-ai/node-DeepResearch 4.6k
https://github.com/jina-ai/node-DeepResearch
langchain-ai/open_deep_research 4.3k
https://github.com/langchain-ai/open_deep_research

根据热度和商业友好度进行排序，锁定我将进一步研究的对象是gpt-researcher。

GPT Researcher的本地化部署

github项目的README文件，简要介绍了部署的过程，支持多种部署方式。我尝试的是基于源码进行的部署，方便修改相关配置。启动服务之后直接在浏览器访问。

根据README文件，我们也可以直接使用pip安装gpt-researcher，当作sdk来使用。如果后面做系统集成，sdk是更好的方式。

上图显示的是这次部署过程对gpt researcher的简单分析。适配本地化环境主要靠修改2个配置文件来完成，一个是.env文件，用来配置API KEY、API BASE等变量。default.py文件，用来配置使用的模型、报告的语言、本地文档、MCP等内容。

上图中点亮的区域是本次实验涉及的内容，即，本次部署只是给gpt researcher接上了本地模型，并没有激活web检索器、本地文档、MCP的部分。后面会逐步尝试。

env文件的内容：

OPENAI_API_KEY=local-llm-key-xxxxxxOPENAI_API_BASE=https://local-llm-base/v1

default文件修改的内容：

DEFAULT_CONFIG: BaseConfig = {    "EMBEDDING": "openai:embedding-model",    "FAST_LLM": "openai:llm-model",    "SMART_LLM": "openai:llm-model",  # Has support for long responses (2k+ words).    "STRATEGIC_LLM": "openai:llm-model",  # Can be used with o1 or o3, please note it will make tasks slower.    "LANGUAGE": "chinese",    "EMBEDDING_KWARGS": {        'tiktoken_enabled': False,        'tiktoken_model_name': 'D:/Models/embedding-model'    },}

模型字符串主要分为2个部分，冒号前面的是提供者，冒号后面的是模型名称。底层使用了langchain连接大模型，不同的provider对应到不同的langchain不同的依赖。

EMBEDDING_KWARGS的配置是为了让OpenAIEmbeddings模型使用本地的tiktoken model。对应这样的修改，还需要额外安装一下transformers包。

修改完上面的配置，就可以README文件中提供的命令启动服务了。虽然没有激活检索功能，但是依然可以生成报告。

小trick：将.env文件内容注册为环境变量

之前我为了研究如何连接本地大模型，关注到了.env文件，但是一直没有在代码中看到哪里加载的。后来发现它是在main.py文件中，通过下面这两行实现的。效果就是默认将.env文件中的内容加载为环境变量。

from dotenv import load_dotenv  # line 1...load_dotenv()  # line 29

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-23

百度开源 Unlimited OCR：让长文档解析一次完成

2026-06-23

我把自己的需求到交付 Skills 开源了：Analysis to Delivery

2026-06-23

腾讯开源WeKnora知识库部署实战(含踩坑排查)

2026-06-22

DiffusionGemma: 文本生成速度提升 4 倍

2026-06-22

刚刚，百度开源拿下全球第一！作者疑似DeepSeek出走大神

2026-06-22

Agent终于有了自己的邮箱！腾讯Agently Mail详解

2026-06-20

GLM-5.2本地部署：744B参数模型如何在Mac上跑

2026-06-20

Hermes Agent v0.17发布：AI助手开始扩展触角

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Hermes Agent 出来了，聊聊它凭什么跟 OpenClaw 掰手腕

2026-03-30

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

Google Gemma 4 开源｜全面解读

2026-04-03

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

刚刚，Claude Code开源了！51万行代码，全网狂欢

2026-03-31

龙虾绝配：Qwen 3.5 27B！跑在家里，成本为 0

2026-03-30

Ollama 本地部署 Gemma 4 完全指南

2026-04-18

Google Gemini CLI 完整使用指南

2026-04-18

CoPaw深度解析：源码架构和功能实践

2026-03-31

炸裂！Seedance 2.0 免费用！全网第一只接入的开源龙虾，效果离谱

2026-04-02

大家都在问

26.1%的AI编程技能有漏洞：NVIDIA开源 SkillSpector 能扫出什么？

2026-06-16

企业级 AI Agent 为什么集体转向“基座 + Skills”？

2026-05-30

Hermes Agent 深度解析：为什么它能“越用越懂你”？

2026-05-16

百度把Nano Banana塞进4090，疯了？

2026-04-22

Kimi K2.6 开源了！还附送了 300 个 Agent 员工？

2026-04-21

Hermes 凭什么两个月接棒 OpenClaw？

2026-04-15

很多人突然不玩小龙虾而用Hermes Agent了。我替你试了，跟小龙虾到底有啥不同？

2026-04-09

震惊！刚刚，Anthropic掀了桌子：OpenClaude横空出世，大模型闭源时代彻底终结？

2026-04-01

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw