2026年6月4日 周四晚上19:30,报名腾讯会议了解“业务抓夹如何成为前线部署工程师(FDE)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


我要投稿

真正的AI知识库

发布日期:2026-05-28 07:21:59 浏览次数: 1552
作者:newtype AI

微信搜一搜,关注“newtype AI”

推荐语

用AI将知识“编译”成不断进化的Wiki,告别重复检索,实现真正的知识累积。LLM Wiki方法让AI成为你的知识库工程师。

核心内容:
1. 传统AI知识库(RAG与Agent)的局限与核心问题
2. 卡帕西LLM Wiki的核心原理与工作流程
3. 如何将LLM Wiki方法融入现有知识库并开始实践

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家


2026年,如果你想搭建自己的AI知识库的话,我强烈建议你采用卡帕西的方法:LLM Wiki。


你先记住我这个结论:这套做法的本质,是把AI从“一次性检索生成器”升级成了“持续知识编译器”。


我带你回顾一下,你就完全理解了。


以前大家是怎么做的?两种做法:


最早是用RAG,也就是把文档切割、向量化,然后让大模型去检索。


这种做法门槛很高,局限性也挺大。于是后来很多人改用Claude Code之类的工具,直接让Agent去遍历所有文档。


这两种做法虽然完全不同,但它们的问题其实是一样的,也就是,你每次提问,AI都得重新读一遍文档。


“每次都得重新发现知识”意味着,Token消耗会很大,尤其是当你知识库越来越大之后。而且一致性会很差,那些矛盾、交叉引用每次都要重新发现,容易出现幻觉或遗漏。


所以,其实过去这两年的AI知识库,只能算是一个半成品。那么,卡帕西做对了什么?他设计了这样一套系统:


你有一个素材库,放所有原始资料,比如文章、论文、笔记、PDF等等。AI会主动把这些资料“消化”成一个结构化的、Markdown格式的Wiki。


Wiki里的内容不是简单的复制粘贴,而是包含了实体页、主题总结页等等。它是AI完整理解了你所有内容之后生成的东西。


你提问的时候,AI会去查询Wiki,而不是每次都去原始素材里翻。AI回答完了,还可以把好答案存回Wiki,让知识继续累积。


之后你每次添加新资料进知识库,AI还会主动更新整个Wiki。


所以,在你的知识库里,AI不再是每次回答都得查资料的秘书,而是一个知识库工程师。它替你把知识“编译”成一个不断进化的Wiki。


这个才是AI知识库该有的样子!


而要实现也很简单。卡帕西发布了一个Gist。你把这个链接给AI,然后它就知道怎么做了。我已经成功了。本期视频,咱们就来聊一下具体的实现方法。


哈喽各位好,欢迎回到我的频道。谦虚地说,我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西远比教程更值钱。记得点一波关注。如果想链接我,就来我们newtype社群。这个社群已经运营700天,有超过2000位小伙伴付费加入啦。


如果你是国内用户,可以从知识星球加入。如果你是海外用户,可以从Substack加入。我的第一套课程、日常的Newsletter以及专属视频,在社群内都可以看到。


回到今天的主题:LLM Wiki。


卡帕西的这套方法,不管你是用Claude Code还是别的AI工具,都适用。比如我就在用我自己做的newtype OS。


因为我的知识库已经搭建好了,所以我不是要照搬卡帕西的结构,而是要把Wiki融合进来。


在一开始,我把链接给到主Agent——Chief的时候,我就让它结合目前知识库的情况做个评估。它给出的结论是:


我跟卡帕西在做的是同一件事。比如我已经有INPUT文件夹用来存原始素材;有AGENTS和KNOWLEDGE两个Markdown文档作为纲领性文件。唯独缺少中间层,也就是Wiki。


虽然Chief建议我把Wiki放到PROCESSING文件夹里,但是我还是决定基于OUTPUT建立Wiki。


OUTPUT文件夹里存放的是我的笔记、文章以及视频脚本。它们都是成品,是我亲手写的。基于这些资料建立Wiki才是最准确的。


所以,虽然AI可以帮你搞定很多事,但是这个知识库该是什么样的,这个大方向必须由你来把握,你得动脑子好好想想。否则就变成AI的知识库了,不是吗?


当你跟AI商量好了、交代清楚之后,剩下就不用管了,AI会自动完成。


这个过程花的时间可能会很长,因为AI需要先消化你所有的内容。我这边有三个文件夹需要处理。于是Chief决定兵分三路,创建三个后台任务让子Agent去执行。


当三路扫描的综合分析都搞定之后,Chief给出Wiki的设计方案。整个结构分了好几层,比如概念层是我原创的、反复出现的、有完整论证的概念。


当我确认方案之后,Chief把活儿派出去、并行完成。你看这个就是多Agent编排系统的好处。


整个过程我等了得有20分钟,确实是个大活儿。不过最终完成得挺漂亮的。我给你们看看成品。


概念层里的东西,是我之前提过的各种概念,包括AI OS、Code is intent、万物皆文件等等。每一个概念的Markdown文档里,都有非常详细、完整的表述。这些都是AI从我过往资料里提取出来的。


实体层里的东西,是各种内容所涉及到的实体。比如卡帕西这个人,还有Claude这个模型,都是我过去经常提到的。


线索层里的东西,是可以归纳到一起的大主题。比如“AI工程三部曲”等等。我之前写的内容确实不是独立的主题,很多都可以归纳到一个大主题或者专栏里。AI全面理解之后,用逻辑把它们串起来了。


另外还有几个纲领性文件。比如Index文档是结构性的,Log文档则是按时间来排的。这种横向和纵向的整理,让AI对整个知识库有了非常详细的了解,确实会比之前单纯搜索强很多。


整个Wiki的使用方法,在知识库最底层的AGENTS文档里也有记录。以后AI就知道什么时候要去读取或者写入Wiki了。比如,当我往OUTPUT文件夹里存入新的稿子,AI会自动对它进行处理,添加进Wiki。


你看,用卡帕西的做法更新完知识库之后,是不是厉害多了?原本“死”的文档,在Wiki加入之后“活”过来了。AI的检索效率会大大提升。而且我们在Obsidian里去查看也很方便。


所以这个是非常非常值得去做的事情。大家看完视频一定要试一试。


OK,以上就是本期内容。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询