2026年6月25日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

AI 知识库开始分叉:LLM Wiki 和 GBrain 真正的差别

发布日期:2026-06-23 14:17:14 浏览次数: 1536
作者:诸司码技

微信搜一搜,关注“诸司码技”

推荐语

知识库正在从简单检索向操作系统演进,LLM Wiki 和 GBrain 代表了两种核心路径。

核心内容:
1. LLM Wiki:强调知识的“编译”与结构化,构建稳定可维护的知识层。
2. GBrain:聚焦知识的“持续运行”,打造集成工程基础设施的长期系统。
3. 共同目标:超越传统RAG的临时检索,实现知识的系统化与自动化。

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

如果你现在还在给 AI 喂 PDF、喂网页、喂笔记,然后期待它自己变聪明,那你可能搞错了一层。

真正厉害的,不是让 AI 多读点资料,而是有人已经开始给 AI 造“知识操作系统”了。

这也是我看 LLM Wiki 和 GBrain 时最大的感受。它们看起来都在做 AI 知识库,但实际上回答的是两个完全不同的问题:一个在回答知识怎么被编译,另一个在回答知识怎么持续运行。

先说 LLM Wiki

LLM Wiki 这个思路,最早来自 Andrej Karpathy 提出的 LLM Wiki pattern。

它的核心想法不是把一堆资料直接丢给模型临时检索,而是先把原始资料整理成一套稳定的 Wiki 知识层,再让 AI 在这套知识层上工作。

这和很多人理解的“知识库”不太一样。普通知识库更像是把资料放进去,等提问时再临时捞几段相关文本。LLM Wiki 更强调先把知识编译出来:概念怎么组织,页面怎么形成,主题之间怎么关联,规则文件怎么约束查询和维护。

所以后来社区把这套方法论做成具体项目时,LLM Wiki 更像是把 Karpathy 的“知识先编译、再使用”这条路线产品化了。

它回答的问题不是“AI 能不能搜到资料”,而是“这些资料能不能变成一套稳定、可读、可维护的知识表达”。

再看 GBrain

GBrain 走的是另一条路。

这个项目来自 Garry Tan,也就是 YC 现在的 CEO。它不是一个纯研究感很重的知识库 demo,更像是一个长期在用 Agent 的人,直接把自己需要的知识运行系统做出来了。

如果说 LLM Wiki 回答的是“知识怎么写”,那 GBrain 回答的是“知识系统怎么持续运行”。

它保留了页面这种可读、可编辑的形态,但在上面又加了一整层工程基础设施:数据库、向量检索、关键词索引、知识图谱、自动化流程,还有多媒体处理。

这意味着 GBrain 不只是一个知识组织方法。它更像一个长期运行的知识系统。

比如一场客户会议录音,在普通知识库里,它可能只是一个附件。可是在 GBrain 里,它会被转录,生成页面,更新实体,补到时间线里,再建立索引。你后面提问时,面对的已经不是那段原始录音,而是一组被拆解和结构化过的知识对象。

这正是它和普通文件型知识库最根本的区别。

它们共同反对的,其实都是传统 RAG

RAG 是 Retrieval-Augmented Generation 的缩写,一般翻译成“检索增强生成”。它的基本做法是:先把外部资料切成片段并建立索引,用户提问时再从这些片段里检索出几段相关内容,最后交给大模型生成答案。

传统 RAG 本质上还是临时检索。

你把 PDF、网页、笔记扔进去,系统临时捞几段相关文本,再交给模型拼答案。它方便,但问题也很明显:同一个问题多问几次,答案可能不一样;新资料进来,旧知识不会自动重组;问完就结束,下次还得重新捞材料。

所以真正的问题不是 AI 能不能搜到信息,而是 AI 能不能把零散资料慢慢沉淀成一套可复用、可维护、可持续更新的知识层。

LLM Wiki 和 GBrain 都是在反对“临时捞材料”这件事。只是它们往前走的方向不一样。

LLM Wiki 选择先把资料编译成百科,再让 AI 用。GBrain 则选择把知识做成一个可以持续运行、持续更新、持续被任务调用的系统。

LLM Wiki 更像知识编辑流程

LLM Wiki 的核心单位是页面。

底层是原始资料,中间层是按主题、人物、概念整理好的 Wiki 页面,顶层是一套规则文件,规定知识怎么收录、怎么查询、怎么维护。

它关心的重点不是收了多少资料,而是有没有形成稳定的知识表达。

这对个人研究、写作素材管理、小规模专题整理特别有价值。因为这类场景里,最重要的往往不是让系统自动跑起来,而是让知识变得清楚、透明、可追溯。

你需要知道某个结论来自哪里,某个概念和哪些资料相关,某个主题下已经沉淀了哪些页面。LLM Wiki 这条路线的优势,就在于它把知识先变成可以读、可以改、可以长期维护的结构。

GBrain 更像知识操作系统

GBrain 的野心更偏运行层。

它不仅要整理知识,还要让知识参与任务。它要接多种信息源,要处理会议、语音、视频这类多媒体输入,还要让新产生的信息自动更新到系统里。

如果你是给 Agent 搭长期记忆,GBrain 这种路线会更完整。

因为 Agent 真正进入工作流以后,问题就不只是“能不能找到答案”了。系统还需要知道:这条信息属于哪个实体,和哪个项目有关,应该更新到哪条时间线,是否会影响已有结论,下一次任务该不该调用它。

从这个角度看,GBrain 更像是在知识层上再搭一个运行层。它把资料、页面、索引、实体、时间线、自动化流程放在一起,让知识不只是被查询,而是可以随着工作不断流动。

两条路线的本质差别

可以把这两个方向放在一张表里看:

维度
LLM Wiki
GBrain
核心问题
知识怎么被编译
知识系统怎么持续运行
核心单位
页面
页面、实体、索引、流程
更关注
知识表达是否稳定
知识能否参与任务
典型形态
持续更新的百科全书
知识操作系统
更适合
个人研究、写作素材、小规模专题整理
Agent 长期记忆、多信息源、多媒体输入、自动更新

所以两条路线的本质差别就在这里:LLM Wiki 更像是在给 AI 写一本持续更新的百科全书,GBrain 更像是在这本百科之上,再搭一个知识操作系统。

一个偏知识表达层,一个偏知识运行层。

最后怎么选

如果你现在做的是个人研究、写作素材管理、小规模专题整理,LLM Wiki 会更轻、更透明。它能帮你把资料变成稳定页面,适合反复阅读、引用和维护。

但如果你是在给 Agent 搭长期记忆,要接多种信息源,还要支持会议、语音、视频这类多媒体输入,并且希望知识可以自动更新,那 GBrain 会更完整。

这不是谁替代谁的问题,而是 AI 知识库正在开始分叉。

过去我们关注的是“怎么检索更准”。现在更关键的问题变成了:知识到底应该先被编译成 Wiki,还是直接被做成一个持续运行的系统?

这两个方向,可能会决定下一代 Agent 的知识层长什么样。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询