微信扫码
添加专属顾问
我要投稿
Karpathy亲授的AI知识库搭建指南,手把手教你从零打造个人第二大脑,让AI成为你的知识管家。核心内容: 1. 三步搭建本地AI知识库的基础架构 2. 无压力收集原始资料的实用技巧 3. 自动化工具与AI协同工作的操作指南
这几年,大家都在说「第二大脑」、「知识管理」,但很多人依然停留在「听起来很厉害」的阶段。真正卡住我们的,往往不是概念,而是一个问题:我到底该从哪一步开始做?
今天这篇文章,就是给完全没有基础的小白写的,从零开始,手把手带你在本地搭建一个 AI 驱动的知识库,让 AI 帮你整理资料、搭建个人 Wiki,当你的「第二大脑」。这套方法对个人知识工作者、也对咨询公司都有非常大的参考价值,尤其是那些还没把知识管理当回事、但又想先试试水的团队。
本文的内容基于之前Andrej Karpathy写的Second Brain,我们针对读者做了一些调整,然后给出了一些markdown的格式模块。对原文感兴趣的,可以上网搜索,或者后台留言。
我们做四件事:
下面一步一步来。
你可以在任何位置新建一个项目文件夹,例如叫 my-knowledge-base。里面再建三个子文件夹:raw/、wiki/ 和 outputs/。
my-knowledge-base/
raw/ (your source material - articles, notes, screenshots)
wiki/ (where your AI will write the organized version)
outputs/ (answers, reports, and research your AI generates)
三个文件夹的作用非常简单:
到这里为止,你已经完成了整个系统最重要的基础搭建。
大多数人卡在这一步:文件夹建好了,却不知道要放什么进去。
答案其实只有两个字:全部。
你可以往 raw/ 里塞这些东西:
重点是:不要先整理,不要改文件名,不要分类,这是 AI 的工作。
可以让最近火爆的小龙虾,或者手动新建文件也完全没问题,只要最后都丢进 raw/ 即可。
如果你现在脑子一片空白,不知道放什么,可以先选一个主题,比如「品牌营销」「行业研究」「AI 学习」,把你已经有的所有相关资料,统统扔进去就行。
人工一篇篇复制网页内容很累,用 AI 来帮你做「网页爬虫」会高效很多。这里用到的是一个免费的命令行工具:agent-browser。
它的作用很直接:让你的 AI 能够控制一个真正的浏览器,打开网页、滚动、点击「加载更多」,然后把内容抽出来写成文件。
3.1 安装 agent-browser前提是你已经安装了 Node.js(如果不会,可以让公司技术同事帮你装一下)。安装命令只有两行:
npm install -g agent-browser
agent-browser install
第二条命令会自动下载一个专用的 Chrome 浏览器,给 AI 用来访问网页。
3.2 抓一篇网页进 raw/ 假设你看到一篇好文章,想把全文存入 raw/ 文件夹,可以这样做:
# 1. 用 agent-browser 打开页面
agent-browser open https://some-article-you-want.com
# 2. 抓取页面中 <article> 区域的文本
agent-browser get text "article" > raw/web_article_01.txt
上面第二行命令的意思是:从网页上找到 article 这个区域,把里面的文字抽出来,重定向保存到 raw/web_article_01.txt 文件。
网络上有很多关于Agent browser的信息。
agent-browser 的好处是,可以处理很多普通复制粘贴搞不定的页面,比如需要滚动加载的长文、登录后才能访问的研究报告等,同时还能大量节省 token 成本。
如果你对命令行很不熟,这一步可以先跳过,先用手动复制的方式建立第一版知识库,等你习惯之后再慢慢引入自动化工具。
现在你已经有了三层结构:项目文件夹 + 三个子文件夹 + 一堆原始资料。接下来,需要告诉 AI:这些资料是关于什么的、要怎么整理。
我们用一个非常简单的文本文件来做这件事,叫做 CLAUDE.md(名字你可以随便取,比如 AGENTS.md、README.md 都行)。
在项目根目录里创建这个文件,内容可以使用下面的模板,然后按你的场景做一些替换即可:
# Knowledge Base Schema
## What This Is
A personal knowledge base about [YOUR TOPIC].
## How It's Organized
- raw/ contains unprocessed source material. Never modify these files.
- wiki/ contains the organized wiki. AI maintains this entirely.
- outputs/ contains generated reports, answers, and analyses.
## Wiki Rules
- Every topic gets its own .md file in wiki/
- Every wiki file starts with a one-paragraph summary
- Link related topics to each other using [[topic-name]] format
- Maintain an INDEX.md in wiki/ that lists every topic with a one-line description
- When new raw sources are added, update the relevant wiki articles
## My Interests
[List 3-5 things you want this knowledge base to focus on]
如果你是做咨询的,比如专注在「消费品行业」,可以这样填写 What This Is 和 My Interests:
text
## What This Is
A knowledge base about consumer goods industry research, brand strategy, and go-to-market best practices.
## My Interests
- Brand positioning frameworks
- Successful case studies in FMCG
- Go-to-market strategies in China and Southeast Asia
- Consumer behavior insights for Gen Z
这个 Schema 文件的本质,就是一份「规则说明书」:不需要复杂的数据库,不需要安装插件,AI 只要读懂这份说明,就知道该如何组织你的知识库。
基础设施搭好了,接下来就是系统的灵魂:让 AI 自己把 raw/ 里的杂乱资料,整理成 wiki/ 里的结构化知识。
推荐用支持「读本地文件」的 AI 工具,例如 Claude Code、Cursor、VS Code + AI 插件等。核心思路是:把项目文件夹打开,让 AI 扫描 raw/ 和 CLAUDE.md,然后按照规则生成 wiki/ 内容。
一个典型的提问(Prompt)可以这样写(英文效果通常会更稳定):
text
You are my knowledge base maintainer.
1. Read all files in the raw/ directory.
2. Read the schema and rules in CLAUDE.md.
3. Create or update files in the wiki/ directory according to these rules:
- Create an INDEX.md first, listing all major topics with one-line descriptions.
- For each major topic, create a separate .md file in wiki/.
- Each wiki file must start with a one-paragraph summary.
- Use [[topic-name]] links to connect related topics.
4. Do not modify any file in raw/.
5. When you are done, briefly report which wiki files you created or updated.
执行之后,你会在 wiki/ 文件夹里看到一堆新生成的 .md 文件,内容一般会包括:
从这一步开始,你就拥有了一个由 AI 维护的「活的百科全书」。
有了 Wiki 之后,你要做的就不是「维护知识库」,而是「向自己的知识库提问」。
比如:
text
Based on everything in the wiki/ directory,
what are the three biggest gaps in my understanding of [某个主题]?
或者:
text
Compare what source A says about [某个概念]
with what source B says. Where do they disagree?
Only use information from raw/ and wiki/.
又或者:
text
Write a 500-word briefing in Chinese on [某个主题],
using only the information in this knowledge base (raw/ + wiki/).
Structure it with a clear summary and 3 main points.
当 AI 给出答案后,**你可以让它自动把这次输出存进 outputs/**,或者直接更新相关的 wiki/ 文章。
例如,你可以在对话中加一句:
text
After generating the answer, save it as a new markdown file
in the outputs/ directory, with a descriptive filename.
这样,每一次提问,都会让你的知识库变得更厚、更系统,也更贴合你的工作场景。
因为 AI 也会犯错,如果你完全不检查,错误也会随着知识的积累而不断放大。解决办法很简单:让 AI 自己做周期性的「健康检查」。
可以每月或每季度,给 AI 一个这样的任务:
text
Act as a knowledge base auditor.
1. Review all files in the wiki/ directory.
2. Flag any contradictions between articles.
3. Find topics that are mentioned but never properly explained.
4. List any claims that do not have supporting sources in raw/.
5. Suggest 3–5 new wiki articles or sections that would significantly improve coverage and clarity.
Return your findings as a markdown report.
然后把这份报告存到 outputs/ 里,再根据报告指引,对 raw/ 和 wiki/ 做增补和修正。
这就是让你的「第二大脑」既能不断长大,又能保持健康的关键一步。
很多人一听到「知识库」,第一反应就是:我要用哪个软件?是 Obsidian、Notion,还是某个新出的 AI 工具?
但这里的核心思路非常朴素:一个文件夹结构 + 一堆 Markdown 文本 + 一个清晰的 schema 文件,就足够了。
你可以:
真正重要的,不是你用什么软件,而是你有没有一个可持续的结构,让 AI 能理解并且长期维护。
很多团队陷入的陷阱,是在工具上花了大量时间,插件装了一堆,但真正能落地的知识管理流程却没有建立起来。这一套「三文件夹 + 一个 Schema 文件 + AI」的方法,恰恰是反过来的:从结构和流程出发,工具只是表层的皮肤。
对个人知识工作者来说,这套体系可以帮你把平时「看过就忘」的文章、项目经验、思考碎片,沉淀成一个可搜索、可复用、越来越聪明的「第二大脑」。
对咨询公司、研究机构、智库或任何高度依赖知识资产的团队来说,它更是一个现成的可落地实践方案:
尤其是在很多公司内部,大家嘴上都说「知识很重要」,但实际上没有时间、没有人力去做系统知识管理的时候,这套方法是一个非常适合「从 0 到 1」的起点。
你完全可以先从一个小主题、小团队开始试点,比如「某条产品线的案例库」\「某个行业的研究库」,等做出一点效果再逐步扩展。
无论你是一个个人创作者、独立咨询顾问,还是在公司里希望推动知识管理落地的人,都非常值得花一个周末亲手搭一次这样的「第二大脑」。你会发现,真正改变工作效率的往往不是某个炫酷的新工具,而是一个简单、可执行、可以坚持下去的知识管理方法论。
由于 Karpathy 发的这篇文章也是比较新的,所以我们也在尝试使用这个方法来搭建自己的知识库。
我们也会在后续更新关于知识库的一些内容。但在 AI 时代,未来一定是属于愿意尝试的人的。
欢迎评论区留言。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-04-08
中台已死,语义层将重塑数据架构|爱分析访谈
2026-04-07
本体+ 大模型:Knora 如何破解企业AI落地中的幻觉与执行断层难题
2026-04-07
Karpathy知识库「LLM Wiki」火爆了,全网围观讨论
2026-04-07
Karpathy又双叒叕发新概念了,这次我替你找到了那个产品
2026-04-07
我试了 Karpathy「让知识自己长出来」的方法,踩了 4 个坑
2026-04-07
AI大神卡帕西的知识管理方法刷屏,用Get笔记六步抄作业
2026-04-01
把“填表”变成一句话:我们做了一个AI填表助手
2026-04-01
大模型时代本体论Ontology驱动的AI知识引擎助力企业智能决策系统的未来进化-一篇献给企业董事会和CIO的深度思考(第一篇)
2026-03-05
2026-02-11
2026-01-13
2026-02-11
2026-02-20
2026-03-23
2026-01-09
2026-03-31
2026-01-25
2026-03-02
2026-03-02
2026-02-27
2025-12-09
2025-11-22
2025-11-18
2025-11-13
2025-11-12
2025-09-23