微信扫码
添加专属顾问
我要投稿
想要在本地搭建一个会学习的AI助手?Hermes Agent + Ollama指南,手把手教你从安装配置到体验核心功能。核心内容:1. Hermes Agent的核心优势:自动学习与三层记忆结构2. 本地环境搭建与Ollama部署的详细步骤3. 实际应用演示与多平台支持说明
作者:AI拉呱(Errol Yan)
定位:AI领域深度内容与实战方法分享
自从 OpenClaw 发布以后,几乎每周都会冒出新的 agent 项目,让人很难一个个都试过去。但最近有一个新项目,确实吸引了不少注意力,它就是 Hermes Agent。
它在 GitHub 上的 star 数虽然远不及 OpenClaw,但它并没有走“比谁 memory 更大”的路线,而是更强调性能和学习能力。所以,它很可能不是简单的替代品,而是这个领域里另一条值得关注的产品路径。
2026 年 3 月,Nous Research 推出了 Hermes Agent。 它是一个开源 agent framework,重点在于解决“AI 失忆”和“长期个体化”这两个问题。
如果你以为这只是又一个新聊天机器人,那其实不太对。Hermes 更接近一个会学习的 AI agent。你用得越久,它越会把自己的经验整理成可复用 skills,持续改进,保存有价值的信息,甚至还能搜索过去的会话。
它还支持多平台,包括 Telegram、Discord、Slack、WhatsApp、Signal 和 CLI,并兼容 200 多个模型端点,例如 OpenRouter、Nous Portal、OpenAI 和 Anthropic。部署方式也很灵活,从 5 美元 VPS 到 GPU 集群,再到几乎零空闲成本的 serverless 架构都可以跑。
这是 Hermes 最有辨识度的能力之一。
举个例子,如果你让 Hermes “用 Docker 部署一个服务”,它执行完之后,会把完成这个任务的关键步骤自动保存成一个 skill。下次你再让它做类似工作时,它就可以更快、更稳定地复用之前积累的经验。
更重要的是,这些 skills 不是一劳永逸写死的,它们还能随着使用被持续修正和更新。
相比之下,很多其他 agent 的 skills 更多还是人工编写、人工维护。而 Hermes 的思路更接近“把你的真实使用过程,逐渐沉淀成机器自己的能力资产”。
很多 AI 一旦会话结束,就相当于把你忘了。但 Hermes 尝试从结构上解决这件事。
它的 memory 分成三层:
因此,如果你问它“还记得上周我们聊过 Nginx 配置吗?”,它可以搜索历史 session 再回答,而不是完全从零开始。
Hermes 支持 Telegram、Discord、Slack、WhatsApp、Signal、Email/SMS、Home Assistant、Matrix/Mattermost、DingTalk 和 CLI 等多个入口。
重点不是“能接很多平台”,而是:这些平台共享的是同一个 agent 和记忆体系。
这意味着你可以早上用 Telegram 给它布置任务,晚上在 Discord 上追问进展,它依然知道自己是谁,也知道你们刚刚在做什么。
Hermes 的 memory 不是简单的历史归档,而是更偏“执行与个体化”的基础设施。
它把 memory 分成短期记忆、长期记忆和技能记忆,每层负责的事情不同:
其中最有意思的是“技能记忆”。
例如,如果你多次让它“每周一生成进度报告”,Hermes 会在内部逐渐把这件事总结成一个稳定 skill。之后它不仅更快,而且输出格式也会越来越贴近你的习惯。
这就是它所谓“自我改进”的核心:不是模型本身会自动升级,而是执行经验在被持续结构化。
Hermes 可以跑在 Telegram、Discord、Slack、WhatsApp 和 CLI 等不同入口。
这带来的好处是,你不必为每个平台都单独培养一个 agent。你面对的是同一个知道你偏好、记得你上下文的 AI,只是入口换了。
我自己试过 CLI 方式,但如果放在实际使用里,Telegram bot 反而可能是更实用的方案。因为你可以直接用手机对话,而且它还能保持上下文连续。
Hermes 更适合这些场景:
OpenClaw 更适合这些场景:
所以这两个项目,不一定是非此即彼。它们完全可以共存:一个更偏“舰队级协调”,一个更偏“个人长期助理”。
下面进入真正的安装过程。
Hermes 支持 Linux、macOS 和 Windows(包括 WSL)。最理想的部署方式通常是在 VPS 或闲置设备上长期运行;不过这篇演示是在本地 Mac 上完成的,体验也没有问题。
安装命令只有一条:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
它会自动创建虚拟环境,并装好需要的 Python 与 Node.js 依赖。
安装完成后,首先会进入一个 setup wizard,整体分成五个步骤:
你只需要一路按流程走。
如果机器上已经装过 OpenClaw,它会自动检测 ~/.openclaw 下的已有数据,并询问你是否迁移配置、memory、skills 和 API keys。
如果你是 OpenClaw 老用户,直接迁移会省很多时间;如果你想全新开始,也可以先跳过,之后再补做迁移。
在 Provider 选择阶段,我们可以直接选 Custom OpenAI-compatible endpoint,因为 Ollama 正好符合这个接口形式。
随后输入 Ollama 的本地地址:
http://localhost:11434/v1
这里的 11434 是 Ollama 默认端口,/v1 是兼容 OpenAI 风格 API 的路径。
如果全部本地运行,API key 可以留空。模型则可以填入你已经提前拉下来的本地模型,例如 gpt-oss:20b,context length 可以交给 Hermes 自动识别。
在 Agent Settings 里,可以重点关注三项:
在 Session Reset Policy 里,也可以启用按空闲时间或每日固定时间自动 reset。这样会话不会无限膨胀,但重要信息仍会先被保存。
一个相对稳妥的默认组合是:24 小时无操作自动 reset,加上每天凌晨固定 reset 一次。
消息平台部分,如果你暂时只想在本地试跑,可以先全部跳过,后面需要时再配置 Telegram、Discord、Slack、Matrix 或 WhatsApp。
工具配置阶段,Hermes 的能力会一下子完整起来:网页搜索、浏览器控制、终端访问、文件处理、代码执行、vision、memory 等,大多数默认就已开启。
对于 browser automation,可以选择 Local Browser;对于 text-to-speech,可以保留默认的 Microsoft Edge TTS;对于 web search,如果不想接付费服务,也可以先用内置的 DuckDuckGo。
安装完成后,直接输入:
hermes
你会看到 dashboard 与已经加载好的 tools 和 skills。不过有时状态栏默认显示的还是 Claude,而不是本地模型。
这时退出后执行:
hermes model
然后选择刚刚保存的本地 endpoint,把模型设为 gpt-oss:20b,URL 仍然用本地 Ollama 地址即可。
重新启动 Hermes 后,状态栏就会显示 gpt-oss:20b,说明当前已经完全本地运行,不再依赖云端。
这时你可以直接输入一句简单的话,比如“hey, how are you doing today?”,看它是否能快速返回正常响应。状态栏中的模型名和上下文大小,也能帮助你确认整个链路确实跑在本机上。
说实话,作为一个较早期版本的项目,它还是有一些粗糙之处。比如 memory 的准确性并不总是稳定,skill generation 偶尔也会跑偏。
但即便如此,这条产品路线本身非常有价值。
今天很多人对 AI 工具最大的不满,并不是模型不够强,而是“上下文总是断掉”。每次开启新对话,都得重新解释项目背景、个人偏好和团队规则,整个过程非常低效。
Hermes Agent 试图正面解决的,正是这个问题。
而且它还是开源的,数据也在自己手里。从隐私和可控性角度看,这一点会让很多团队更放心。
如果说下一阶段 AI 助手真正的竞争焦点是什么,我会认为是 memory。在这条路线上,Hermes Agent 已经是值得持续观察的项目之一。
如果这篇内容对你有启发,欢迎关注「AI拉呱」,获取更多 AI 前沿洞察、实战教程与趋势解读。
下期将继续带来该主题的进阶拆解与实操案例,建议先收藏本文,避免错过更新。
DeepSeek的核心创新点" data-itemshowtype="0" linktype="text" data-linktype="2">DeepSeek的核心创新点
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-20
Qwen3.7来了,全球排名第13,国内第一
2026-05-17
开源、零依赖、R@5 精度 95%:agentmemory 凭什么比 mem0 更值得用
2026-05-16
Hermes Agent 深度解析:为什么它能“越用越懂你”?
2026-05-15
再见 Hermes、小龙虾! 面向 DeepSeek V4 的终端原生编程智能体来了
2026-05-15
GenericAgent 实测:Token 少用 89.6%,还能打赢 Claude Code?上下文密度才是关键
2026-05-14
腾讯开源Agent Memory,让Token消耗降低61%
2026-05-14
agents-hive 开源了:一个面向生产的Harness Agent 工程
2026-05-12
Hermes Agent 完整安装指南
2026-03-30
2026-04-03
2026-03-23
2026-04-09
2026-03-31
2026-03-03
2026-04-01
2026-02-22
2026-03-04
2026-03-09
2026-05-16
2026-04-22
2026-04-21
2026-04-15
2026-04-09
2026-04-01
2026-03-17
2026-03-13