微信扫码
添加专属顾问
我要投稿
知识库正在从简单检索向操作系统演进,LLM Wiki 和 GBrain 代表了两种核心路径。 核心内容: 1. LLM Wiki:强调知识的“编译”与结构化,构建稳定可维护的知识层。 2. GBrain:聚焦知识的“持续运行”,打造集成工程基础设施的长期系统。 3. 共同目标:超越传统RAG的临时检索,实现知识的系统化与自动化。
如果你现在还在给 AI 喂 PDF、喂网页、喂笔记,然后期待它自己变聪明,那你可能搞错了一层。
真正厉害的,不是让 AI 多读点资料,而是有人已经开始给 AI 造“知识操作系统”了。
这也是我看 LLM Wiki 和 GBrain 时最大的感受。它们看起来都在做 AI 知识库,但实际上回答的是两个完全不同的问题:一个在回答知识怎么被编译,另一个在回答知识怎么持续运行。
LLM Wiki 这个思路,最早来自 Andrej Karpathy 提出的 LLM Wiki pattern。
它的核心想法不是把一堆资料直接丢给模型临时检索,而是先把原始资料整理成一套稳定的 Wiki 知识层,再让 AI 在这套知识层上工作。
这和很多人理解的“知识库”不太一样。普通知识库更像是把资料放进去,等提问时再临时捞几段相关文本。LLM Wiki 更强调先把知识编译出来:概念怎么组织,页面怎么形成,主题之间怎么关联,规则文件怎么约束查询和维护。
所以后来社区把这套方法论做成具体项目时,LLM Wiki 更像是把 Karpathy 的“知识先编译、再使用”这条路线产品化了。
它回答的问题不是“AI 能不能搜到资料”,而是“这些资料能不能变成一套稳定、可读、可维护的知识表达”。
GBrain 走的是另一条路。
这个项目来自 Garry Tan,也就是 YC 现在的 CEO。它不是一个纯研究感很重的知识库 demo,更像是一个长期在用 Agent 的人,直接把自己需要的知识运行系统做出来了。
如果说 LLM Wiki 回答的是“知识怎么写”,那 GBrain 回答的是“知识系统怎么持续运行”。
它保留了页面这种可读、可编辑的形态,但在上面又加了一整层工程基础设施:数据库、向量检索、关键词索引、知识图谱、自动化流程,还有多媒体处理。
这意味着 GBrain 不只是一个知识组织方法。它更像一个长期运行的知识系统。
比如一场客户会议录音,在普通知识库里,它可能只是一个附件。可是在 GBrain 里,它会被转录,生成页面,更新实体,补到时间线里,再建立索引。你后面提问时,面对的已经不是那段原始录音,而是一组被拆解和结构化过的知识对象。
这正是它和普通文件型知识库最根本的区别。
RAG 是 Retrieval-Augmented Generation 的缩写,一般翻译成“检索增强生成”。它的基本做法是:先把外部资料切成片段并建立索引,用户提问时再从这些片段里检索出几段相关内容,最后交给大模型生成答案。
传统 RAG 本质上还是临时检索。
你把 PDF、网页、笔记扔进去,系统临时捞几段相关文本,再交给模型拼答案。它方便,但问题也很明显:同一个问题多问几次,答案可能不一样;新资料进来,旧知识不会自动重组;问完就结束,下次还得重新捞材料。
所以真正的问题不是 AI 能不能搜到信息,而是 AI 能不能把零散资料慢慢沉淀成一套可复用、可维护、可持续更新的知识层。
LLM Wiki 和 GBrain 都是在反对“临时捞材料”这件事。只是它们往前走的方向不一样。
LLM Wiki 选择先把资料编译成百科,再让 AI 用。GBrain 则选择把知识做成一个可以持续运行、持续更新、持续被任务调用的系统。
LLM Wiki 的核心单位是页面。
底层是原始资料,中间层是按主题、人物、概念整理好的 Wiki 页面,顶层是一套规则文件,规定知识怎么收录、怎么查询、怎么维护。
它关心的重点不是收了多少资料,而是有没有形成稳定的知识表达。
这对个人研究、写作素材管理、小规模专题整理特别有价值。因为这类场景里,最重要的往往不是让系统自动跑起来,而是让知识变得清楚、透明、可追溯。
你需要知道某个结论来自哪里,某个概念和哪些资料相关,某个主题下已经沉淀了哪些页面。LLM Wiki 这条路线的优势,就在于它把知识先变成可以读、可以改、可以长期维护的结构。
GBrain 的野心更偏运行层。
它不仅要整理知识,还要让知识参与任务。它要接多种信息源,要处理会议、语音、视频这类多媒体输入,还要让新产生的信息自动更新到系统里。
如果你是给 Agent 搭长期记忆,GBrain 这种路线会更完整。
因为 Agent 真正进入工作流以后,问题就不只是“能不能找到答案”了。系统还需要知道:这条信息属于哪个实体,和哪个项目有关,应该更新到哪条时间线,是否会影响已有结论,下一次任务该不该调用它。
从这个角度看,GBrain 更像是在知识层上再搭一个运行层。它把资料、页面、索引、实体、时间线、自动化流程放在一起,让知识不只是被查询,而是可以随着工作不断流动。
可以把这两个方向放在一张表里看:
所以两条路线的本质差别就在这里:LLM Wiki 更像是在给 AI 写一本持续更新的百科全书,GBrain 更像是在这本百科之上,再搭一个知识操作系统。
一个偏知识表达层,一个偏知识运行层。
如果你现在做的是个人研究、写作素材管理、小规模专题整理,LLM Wiki 会更轻、更透明。它能帮你把资料变成稳定页面,适合反复阅读、引用和维护。
但如果你是在给 Agent 搭长期记忆,要接多种信息源,还要支持会议、语音、视频这类多媒体输入,并且希望知识可以自动更新,那 GBrain 会更完整。
这不是谁替代谁的问题,而是 AI 知识库正在开始分叉。
过去我们关注的是“怎么检索更准”。现在更关键的问题变成了:知识到底应该先被编译成 Wiki,还是直接被做成一个持续运行的系统?
这两个方向,可能会决定下一代 Agent 的知识层长什么样。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-23
RAG之后,知识库开始自己长大
2026-06-23
谷歌发布OKF(Open Knowledge Format)规范,它与Karpathy的LLM-wiki是什么关系?
2026-06-23
RAG 的尽头,是 SQL?
2026-06-22
传统RAG已经落伍了?清华大神开源的这个 rag-skill,让知识库检索直接升维
2026-06-22
从个人知识库到企业级 RAG:我们最终选了 WeKnora
2026-06-22
RAG 不是先向量检索再回答:Metadata Filter 才是企业知识库的第一道门
2026-06-21
使用 LangSmith 进行 RAG 评估:构建生产级 RAG 系统的 AI 开发者指南
2026-06-20
RAG 投毒的六个影响因素与防御框架
2026-04-06
2026-04-27
2026-04-02
2026-03-31
2026-04-23
2026-04-20
2026-04-09
2026-04-12
2026-04-22
2026-04-10
2026-06-23
2026-06-23
2026-06-15
2026-06-10
2026-06-10
2026-05-20
2026-05-18
2026-05-11