2026年4月10日 周五晚上19:30,来了解“从个人单点提效,到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

咨询 | Karpathy关于如何构建第二大脑和知识库的内容,我们根据知识工作者行业进行了一些适配,可以直接拿去使用

发布日期:2026-04-08 08:14:44 浏览次数: 1529
作者:增长 Growth Croissance

微信搜一搜,关注“增长 Growth Croissance”

推荐语

Karpathy亲授的AI知识库搭建指南,手把手教你从零打造个人第二大脑,让AI成为你的知识管家。

核心内容:
1. 三步搭建本地AI知识库的基础架构
2. 无压力收集原始资料的实用技巧
3. 自动化工具与AI协同工作的操作指南

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

这几年,大家都在说「第二大脑」、「知识管理」,但很多人依然停留在「听起来很厉害」的阶段。真正卡住我们的,往往不是概念,而是一个问题:我到底该从哪一步开始做?

今天这篇文章,就是给完全没有基础的小白写的,从零开始,手把手带你在本地搭建一个 AI 驱动的知识库,让 AI 帮你整理资料、搭建个人 Wiki,当你的「第二大脑」。这套方法对个人知识工作者、也对咨询公司都有非常大的参考价值,尤其是那些还没把知识管理当回事、但又想先试试水的团队。

本文的内容基于之前Andrej Karpathy写的Second Brain,我们针对读者做了一些调整,然后给出了一些markdown的格式模块。对原文感兴趣的,可以上网搜索,或者后台留言。

我们做四件事:

  • 搭一个简单的文件夹结构
  • 把所有资料丢进原始资料夹
  • 用一个小工具自动抓网页内容(如果技术能力不够,可以手动代替)
  • 写一个「说明书」,让 AI 自动生成你的知识 Wiki,并循环迭代

下面一步一步来。

第一步:创建三个文件夹

你可以在任何位置新建一个项目文件夹,例如叫 my-knowledge-base。里面再建三个子文件夹:raw/、wiki/ 和 outputs/。

my-knowledge-base/
  raw/          (your source material - articles, notes, screenshots)
  wiki/         (where your AI will write the organized version)
  outputs/      (answers, reports, and research your AI generates)

三个文件夹的作用非常简单:

  • raw/:你的「杂物箱」,所有原始资料都往这里扔
  • wiki/:AI 整理好的「知识百科」,结构化内容都会写在这里
  • outputs/:你向 AI 提问后,生成的报告、摘要、对比分析等,都可以存在这里

到这里为止,你已经完成了整个系统最重要的基础搭建。

第二步:往 raw 里疯狂塞东西

大多数人卡在这一步:文件夹建好了,却不知道要放什么进去。

答案其实只有两个字:全部。

你可以往 raw/ 里塞这些东西:

  • 你之前收藏的文章,复制成 .md 或 .txt 文件
  • 微信读书、Kindle 的读书笔记导出
  • 工作中的会议纪要、项目方案
  • 你写过的复盘、邮件内容
  • 各种截图、流程图、PPT 导出的 PDF

重点是:不要先整理,不要改文件名,不要分类,这是 AI 的工作。

可以让最近火爆的小龙虾,或者手动新建文件也完全没问题,只要最后都丢进 raw/ 即可。

如果你现在脑子一片空白,不知道放什么,可以先选一个主题,比如「品牌营销」「行业研究」「AI 学习」,把你已经有的所有相关资料,统统扔进去就行。

第三步:用 Agent-browser 自动抓网页内容(可选但非常香)

人工一篇篇复制网页内容很累,用 AI 来帮你做「网页爬虫」会高效很多。这里用到的是一个免费的命令行工具:agent-browser。

它的作用很直接:让你的 AI 能够控制一个真正的浏览器,打开网页、滚动、点击「加载更多」,然后把内容抽出来写成文件。

3.1 安装 agent-browser前提是你已经安装了 Node.js(如果不会,可以让公司技术同事帮你装一下)。安装命令只有两行:

npm install -g agent-browser
agent-browser install

第二条命令会自动下载一个专用的 Chrome 浏览器,给 AI 用来访问网页。

3.2 抓一篇网页进 raw/ 假设你看到一篇好文章,想把全文存入 raw/ 文件夹,可以这样做:

# 1. 用 agent-browser 打开页面
agent-browser open https://some-article-you-want.com

# 2. 抓取页面中 <article> 区域的文本
agent-browser get text "article" > raw/web_article_01.txt

上面第二行命令的意思是:从网页上找到 article 这个区域,把里面的文字抽出来,重定向保存到 raw/web_article_01.txt 文件。

网络上有很多关于Agent browser的信息。

agent-browser 的好处是,可以处理很多普通复制粘贴搞不定的页面,比如需要滚动加载的长文、登录后才能访问的研究报告等,同时还能大量节省 token 成本。

如果你对命令行很不熟,这一步可以先跳过,先用手动复制的方式建立第一版知识库,等你习惯之后再慢慢引入自动化工具。

第四步:写一份「给 AI 的说明书」—— Schema 文件

现在你已经有了三层结构:项目文件夹 + 三个子文件夹 + 一堆原始资料。接下来,需要告诉 AI:这些资料是关于什么的、要怎么整理。

我们用一个非常简单的文本文件来做这件事,叫做 CLAUDE.md(名字你可以随便取,比如 AGENTS.md、README.md 都行)。

在项目根目录里创建这个文件,内容可以使用下面的模板,然后按你的场景做一些替换即可:

# Knowledge Base Schema

## What This Is
A personal knowledge base about [YOUR TOPIC].

## How It's Organized
- raw/ contains unprocessed source material. Never modify these files.
- wiki/ contains the organized wiki. AI maintains this entirely.
- outputs/ contains generated reports, answers, and analyses.

## Wiki Rules
- Every topic gets its own .md file in wiki/
- Every wiki file starts with a one-paragraph summary
- Link related topics to each other using [[topic-name]] format
- Maintain an INDEX.md in wiki/ that lists every topic with a one-line description
- When new raw sources are added, update the relevant wiki articles

## My Interests
[List 3-5 things you want this knowledge base to focus on]
如果你是做咨询的,比如专注在「消费品行业」,可以这样填写 What This Is 和 My Interests:

text
## What This Is
A knowledge base about consumer goods industry research, brand strategy, and go-to-market best practices.

## My Interests
- Brand positioning frameworks
- Successful case studies in FMCG
- Go-to-market strategies in China and Southeast Asia
- Consumer behavior insights for Gen Z

这个 Schema 文件的本质,就是一份「规则说明书」:不需要复杂的数据库,不需要安装插件,AI 只要读懂这份说明,就知道该如何组织你的知识库。

第五步:让 AI 自动把 raw 编译成 wiki

基础设施搭好了,接下来就是系统的灵魂:让 AI 自己把 raw/ 里的杂乱资料,整理成 wiki/ 里的结构化知识。

推荐用支持「读本地文件」的 AI 工具,例如 Claude Code、Cursor、VS Code + AI 插件等。核心思路是:把项目文件夹打开,让 AI 扫描 raw/ 和 CLAUDE.md,然后按照规则生成 wiki/ 内容

一个典型的提问(Prompt)可以这样写(英文效果通常会更稳定):

text
You are my knowledge base maintainer.

1. Read all files in the raw/ directory.
2. Read the schema and rules in CLAUDE.md.
3. Create or update files in the wiki/ directory according to these rules:
   - Create an INDEX.md first, listing all major topics with one-line descriptions.
   - For each major topic, create a separate .md file in wiki/.
   - Each wiki file must start with a one-paragraph summary.
   - Use [[topic-name]] links to connect related topics.
4. Do not modify any file in raw/.
5. When you are done, briefly report which wiki files you created or updated.

执行之后,你会在 wiki/ 文件夹里看到一堆新生成的 .md 文件,内容一般会包括:

  • 核心概念的定义和总结
  • 来自不同资料的观点对比
  • 相关主题之间的链接(用 [[xxx]] 的形式)
  • 一个 INDEX.md,帮助你快速浏览整个知识库脉络

从这一步开始,你就拥有了一个由 AI 维护的「活的百科全书」。

第六步:持续提问,并把答案存回系统(长期进行)

有了 Wiki 之后,你要做的就不是「维护知识库」,而是「向自己的知识库提问」。

比如:

text
Based on everything in the wiki/ directory,
what are the three biggest gaps in my understanding of [某个主题]?
或者:

text
Compare what source A says about [某个概念]
with what source B says. Where do they disagree?
Only use information from raw/ and wiki/.
又或者:

text
Write a 500-word briefing in Chinese on [某个主题],
using only the information in this knowledge base (raw/ + wiki/).
Structure it with a clear summary and 3 main points.

当 AI 给出答案后,**你可以让它自动把这次输出存进 outputs/**,或者直接更新相关的 wiki/ 文章。

例如,你可以在对话中加一句:

text
After generating the answer, save it as a new markdown file
in the outputs/ directory, with a descriptive filename.

这样,每一次提问,都会让你的知识库变得更厚、更系统,也更贴合你的工作场景

第七步:定期做一次「健康体检」(建议每月一次)

因为 AI 也会犯错,如果你完全不检查,错误也会随着知识的积累而不断放大。解决办法很简单:让 AI 自己做周期性的「健康检查」

可以每月或每季度,给 AI 一个这样的任务:

text
Act as a knowledge base auditor.

1. Review all files in the wiki/ directory.
2. Flag any contradictions between articles.
3. Find topics that are mentioned but never properly explained.
4. List any claims that do not have supporting sources in raw/.
5. Suggest 3–5 new wiki articles or sections that would significantly improve coverage and clarity.

Return your findings as a markdown report.

然后把这份报告存到 outputs/ 里,再根据报告指引,对 raw/ 和 wiki/ 做增补和修正。

这就是让你的「第二大脑」既能不断长大,又能保持健康的关键一步。

第八步:你真的不一定需要 Obsidian(但可以用)

很多人一听到「知识库」,第一反应就是:我要用哪个软件?是 Obsidian、Notion,还是某个新出的 AI 工具?

但这里的核心思路非常朴素:一个文件夹结构 + 一堆 Markdown 文本 + 一个清晰的 schema 文件,就足够了

你可以:

  • 用 Obsidian 打开 my-knowledge-base 文件夹,把 wiki/ 作为你的主库
  • 用 VS Code + AI 插件直接在本地编辑
  • 用任何你顺手的编辑器,甚至系统自带的记事本

真正重要的,不是你用什么软件,而是你有没有一个可持续的结构,让 AI 能理解并且长期维护。

很多团队陷入的陷阱,是在工具上花了大量时间,插件装了一堆,但真正能落地的知识管理流程却没有建立起来。这一套「三文件夹 + 一个 Schema 文件 + AI」的方法,恰恰是反过来的:从结构和流程出发,工具只是表层的皮肤。

这套方法对个人和咨询公司的意义

对个人知识工作者来说,这套体系可以帮你把平时「看过就忘」的文章、项目经验、思考碎片,沉淀成一个可搜索、可复用、越来越聪明的「第二大脑」。

对咨询公司、研究机构、智库或任何高度依赖知识资产的团队来说,它更是一个现成的可落地实践方案

  • 不需要上马昂贵的知识管理系统
  • 不需要一开始就设计复杂的知识分类体系
  • 只要有一台电脑、一些项目资料、一个愿意折腾的同事,就可以在一个周末搭起来

尤其是在很多公司内部,大家嘴上都说「知识很重要」,但实际上没有时间、没有人力去做系统知识管理的时候,这套方法是一个非常适合「从 0 到 1」的起点。

你完全可以先从一个小主题、小团队开始试点,比如「某条产品线的案例库」\「某个行业的研究库」,等做出一点效果再逐步扩展。

无论你是一个个人创作者、独立咨询顾问,还是在公司里希望推动知识管理落地的人,都非常值得花一个周末亲手搭一次这样的「第二大脑」。你会发现,真正改变工作效率的往往不是某个炫酷的新工具,而是一个简单、可执行、可以坚持下去的知识管理方法论

由于 Karpathy 发的这篇文章也是比较新的,所以我们也在尝试使用这个方法来搭建自己的知识库。

我们也会在后续更新关于知识库的一些内容。但在 AI 时代,未来一定是属于愿意尝试的人的。

欢迎评论区留言。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询