用 Obsidian + LLM 搭建一个会自动生长的个人知识库

1

本文整理自 Andrej Karpathy 的文章 《LLM Wiki》
原文链接:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
原文核心观点是:不要只把 LLM 当成临时问答或总结工具,而要让它持续维护一个结构化、可链接、可演进的 Markdown Wiki。Karpathy 在文中也提到,他的实际工作方式是一边开着 LLM Agent,一边开着 Obsidian:Obsidian 是 IDE,LLM 是程序员,Wiki 是代码库。(Gist)


一、核心观点

现在很多人用 LLM 处理资料,方式大多是:

上传文章 → 让 AI 总结 → 复制到笔记软件 → 下次再重新问

这很方便,但问题是:知识没有真正积累。

Karpathy 在《LLM Wiki》中提出了一个更好的思路:不要让 LLM 每次都从原始资料里临时检索、拼接答案,而是让它持续维护一个长期存在的 Wiki。每加入一份新资料,LLM 都会阅读、提炼、归档、补充链接、更新旧页面、标记冲突,让知识库随着时间不断变强。(Gist)

对 Obsidian 用户来说,这个方法尤其适合落地:

Obsidian 负责保存知识,LLM 负责维护知识,人负责判断方向。


二、为什么用 Obsidian 承载这套系统

Obsidian 很适合作为 LLM Wiki 的底座,原因很简单:

第一,Obsidian 的笔记就是本地 Markdown 文件,LLM 可以直接读取、创建和修改。

第二,Obsidian 支持 [[双向链接]],非常适合把人物、概念、文章、项目、问题连接成知识网络。

第三,Obsidian 有 Graph View,可以看到哪些笔记是中心节点,哪些笔记是孤岛。

第四,Obsidian 可以配合 Git,方便查看 LLM 修改了什么,也方便回滚。

所以,这套方法不是“用 AI 总结文章”,而是:

用 Obsidian 管理知识结构,用 LLM 持续维护知识内容。


三、推荐目录结构

可以在 Obsidian Vault 里建立下面这套结构:

Obsidian-Vault/
  00_Inbox/

  01_Raw/
    Articles/
    Books/
    Papers/
    Meetings/
    Podcasts/
    Assets/

  02_Sources/

  03_Concepts/

  04_Entities/

  05_Syntheses/

  06_Questions/

  07_Comparisons/

  90_Index/
    Home.md
    Index.md
    Topics.md

  99_System/
    AGENTS.md
    WIKI_RULES.md
    Log.md
    Templates/

每个目录的作用如下。

00_Inbox/ 是临时收集箱。网页剪藏、文章、临时想法、播客转录先放这里。

01_Raw/ 是原始资料区。这里的内容尽量只新增,不改写。它是事实来源。

02_Sources/ 存放来源摘要。每篇重要文章、论文、会议记录,都可以有一篇对应的 source 笔记。

03_Concepts/ 存放概念页,例如 RAG.mdLLM Wiki.md知识复利.md

04_Entities/ 存放实体页,例如人物、公司、产品、项目。

05_Syntheses/ 存放综合分析。这是最有价值的区域,用来沉淀跨资料形成的判断。

06_Questions/ 存放重要问答。不要让有价值的回答消失在聊天记录里。

07_Comparisons/ 存放对比分析,例如 RAG vs LLM Wiki.md

90_Index/ 是导航区。Index.md 用来列出重要页面和一句话摘要。Karpathy 也强调,index.md 可以帮助 LLM 在回答问题前先定位相关页面,在中等规模知识库中甚至可以暂时替代复杂的向量检索。(Gist)

99_System/ 是规则区。这里放 AGENTS.mdWIKI_RULES.mdLog.md,告诉 LLM 应该如何维护这个 Obsidian Vault。


四、Obsidian、LLM 和人的分工

这套系统能否长期运行,关键在于分工清楚。

Obsidian 负责存储和结构

Obsidian 负责:

本地 Markdown 文件
双向链接
文件夹结构
Graph View
标签
长期保存

它是知识库本体。

LLM 负责维护和整理

LLM 负责:

阅读新资料
提炼核心观点
创建来源摘要
更新概念页
补充双向链接
维护 Index
追加 Log
发现冲突观点
生成综合分析
沉淀重要问答

这些事情人类很容易偷懒,但 LLM 很适合持续执行。

人负责判断和方向

人负责:

选择重要资料
提出好问题
判断哪些内容值得保留
纠正 LLM 的误解
决定知识库研究方向

Karpathy 的原文里也强调,人负责 sourcing、exploration 和 asking the right questions;LLM 负责 summarizing、cross-referencing、filing 和 bookkeeping。(Gist)


五、核心工作流:Ingest 新资料

Ingest 是整套系统最重要的动作。

它不是简单总结一篇文章,而是把新资料融合进已有的 Obsidian 知识库。

第一步:资料进入 Inbox

例如:

00_Inbox/2026-05-09-karpathy-llm-wiki.md

第二步:让 LLM 按规则处理

可以使用这个提示词:

请读取 Obsidian Vault 中的:

00_Inbox/2026-05-09-karpathy-llm-wiki.md

并按照 99_System/AGENTS.md 的规则执行 ingest。

要求:

1. 把原始资料归档到 01_Raw/Articles/
2. 在 02_Sources/ 创建来源摘要笔记
3. 提取关键概念,更新 03_Concepts/ 中的相关页面
4. 必要时创建新的概念页或实体页
5. 使用 Obsidian 双向链接格式 [[页面名]]
6. 更新 90_Index/Index.md
7. 在 99_System/Log.md 追加记录
8. 标记与已有笔记互补、冲突或需要验证的地方
9. 汇报本次创建和更新了哪些笔记

第三步:生成 source 笔记

示例:

---
type: source
title: "LLM Wiki"
author: "Andrej Karpathy"
source: "https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f"
tags:
  - Obsidian
  - LLM
  - Knowledge-Management
status: processed
---

# LLM Wiki

## 一句话总结

Andrej Karpathy 在这篇文章中提出:与其让 LLM 每次临时检索资料,不如让它持续维护一个基于 Markdown 的 Wiki;对 Obsidian 用户来说,这意味着可以把 Obsidian Vault 变成一个由 LLM 协助维护的个人知识系统。

## 核心观点

1. RAG 更像是查询时的临时检索。
2. LLM Wiki 更像是对知识的持续编译。
3. Obsidian 很适合作为 Wiki 的承载层。
4. LLM 可以负责整理、链接、归档和维护。
5. 人应该负责选择资料、提出问题和判断价值。

## 相关概念

- [[Obsidian]]
- [[LLM Wiki]]
- [[RAG]]
- [[知识复利]]
- [[个人知识管理]]

## 后续问题

- 如何避免 Obsidian 变成资料坟场?
- 如何让 LLM 稳定维护双向链接?
- 哪些问答值得沉淀成长期笔记?

六、核心工作流:把重要问答沉淀为笔记

传统聊天最大的问题是:问完就结束了。

但很多时候,真正有价值的不是原始资料,而是你和 LLM 讨论后形成的新判断。

所以,重要问答应该保存回 Obsidian。

例如你问:

基于当前 Obsidian Vault,总结我对个人知识管理的核心方法论。

LLM 应该:

1. 先读取 90_Index/Index.md
2. 找到相关 source、concept、synthesis 页面
3. 综合已有笔记生成回答
4. 判断这个回答是否值得长期保存
5. 如果值得,写入 06_Questions/ 或 05_Syntheses/
6. 更新 Index 和 Log

问题页可以这样写:

---
type: question
tags:
  - Obsidian
  - LLM
  - Knowledge-Management
---

# 如何用 Obsidian + LLM 搭建个人知识库?

## 问题

如何把零散资料变成一个会持续生长的 Obsidian 知识系统?

## 简短答案

核心方法是:用 Obsidian 承载 Markdown 笔记、双向链接和知识结构,用 LLM 负责资料摄入、概念更新、链接维护、索引维护和问答沉淀。

## 相关笔记

- [[Obsidian]]
- [[LLM Wiki]]
- [[RAG]]
- [[知识复利]]

值得沉淀的问题通常有这些特征:

未来还会反复用到
形成了新的判断
能指导行动
涉及多个资料的综合
适合变成文章、报告或方法论

七、核心工作流:定期 Lint 知识库

知识库越大,越需要体检。

常见问题包括:

重复页面
孤立页面
链接断裂
概念混乱
旧结论过时
Index 没有更新
重要概念没有独立页面
source 没有进入 synthesis

Karpathy 原文建议,定期让 LLM 检查 contradictions、stale claims、orphan pages、missing cross-references 和 data gaps。(Gist)

可以每周运行一次这个提示词:

请对当前 Obsidian Vault 执行一次知识库健康检查。

重点检查:

1. 是否有互相矛盾的观点
2. 是否有被新资料取代的旧结论
3. 是否有孤立页面
4. 是否有重要概念被反复提到但没有独立页面
5. 是否有页面缺少来源引用
6. 是否有 Index.md 未收录的页面
7. 是否有值得合并的重复页面
8. 是否有 Inbox 中长期未处理的资料
9. 是否有值得继续研究的问题

请输出:

- 问题清单
- 建议修改
- 可自动执行的修改
- 需要我确认的修改
- 下周最值得研究的 3 个问题

八、AGENTS.md 模板

下面这份可以直接放进:

99_System/AGENTS.md

内容如下:

# Obsidian LLM Wiki Agent Instructions

你是这个 Obsidian Vault 的知识库维护员。

你的任务不是简单回答问题,而是持续维护一个结构化、可追溯、可演进的 Obsidian Wiki。

## 目录结构

- 00_Inbox/:临时收集箱,存放待处理资料。
- 01_Raw/:原始资料区,只读,不随意改写。
- 02_Sources/:来源摘要笔记。
- 03_Concepts/:概念页。
- 04_Entities/:实体页。
- 05_Syntheses/:综合分析页。
- 06_Questions/:重要问题和答案。
- 07_Comparisons/:对比分析页。
- 90_Index/:首页、索引和主题地图。
- 99_System/:系统规则、日志和模板。

## 基本原则

1. 01_Raw/ 是事实来源,不可随意改写。
2. Wiki 笔记是二次加工结果,必须保留来源路径。
3. 优先更新已有页面,必要时才创建新页面。
4. 每次 ingest 都必须更新 Index 和 Log。
5. 使用 Obsidian 双向链接格式:[[页面名]]。
6. 遇到新旧资料冲突时,不要静默覆盖,要明确标记。
7. 不确定的信息必须标记为“待验证”。
8. 重要问答要沉淀为 06_Questions/ 或 05_Syntheses/。
9. 不要为了生成内容而生成内容,要优先保持准确、清晰、可追溯。

## Ingest 工作流

当用户要求摄入新资料时:

1. 阅读 00_Inbox/ 或指定路径中的原始资料。
2. 将资料归档到 01_Raw/ 下合适的分类。
3. 在 02_Sources/ 创建来源摘要笔记。
4. 提取关键概念、实体、论点。
5. 更新相关 03_Concepts/、04_Entities/、05_Syntheses/ 页面。
6. 补充 Obsidian 双向链接。
7. 标记与已有内容的互补、冲突或修正关系。
8. 更新 90_Index/Index.md。
9. 在 99_System/Log.md 追加记录。
10. 向用户汇报本次创建和更新了哪些页面。

## Query 工作流

当用户提出问题时:

1. 先读 90_Index/Index.md。
2. 找到相关 source、concept、entity、synthesis 页面。
3. 阅读相关页面后再回答。
4. 如果答案有长期价值,保存到 06_Questions/ 或 05_Syntheses/。
5. 必要时更新相关概念页和 Index。
6. 在 99_System/Log.md 追加记录。

## Lint 工作流

定期检查:

1. 是否有孤立页面。
2. 是否有重复页面。
3. 是否有过时结论。
4. 是否有缺失链接。
5. 是否有缺少来源的断言。
6. 是否有重要但未建页的概念。
7. 是否有 Index 未收录的页面。
8. 是否有 Inbox 中长期未处理的内容。

九、每日、每周、每月执行节奏

每日:轻量输入

每天 10 到 20 分钟即可:

1. 把当天看到的重要资料放入 00_Inbox/
2. 选择 1 条最重要资料执行 ingest
3. 检查 LLM 创建和更新了哪些页面
4. 提一个追问
5. 把有价值的回答沉淀为 Obsidian 笔记

每周:结构整理

每周做一次维护:

1. 清理 00_Inbox/
2. 执行一次 Lint
3. 合并重复概念
4. 检查孤立页面
5. 更新 90_Index/Topics.md
6. 总结本周新增的关键洞察

每月:形成输出

每月做一次综合:

1. 更新 05_Syntheses/ 下的重要综合页
2. 整理当前最重要的 10 个结论
3. 标记已经过时的观点
4. 规划下月资料摄入方向
5. 从 Obsidian 中生成一篇可发布文章

十、检查清单

新资料摄入后检查

[ ] 是否归档了原始资料
[ ] 是否创建了 source 页面
[ ] 是否提取了核心观点
[ ] 是否更新了相关 concept 页面
[ ] 是否补充了 Obsidian 双向链接
[ ] 是否标记了冲突或待验证内容
[ ] 是否更新了 Index
[ ] 是否追加了 Log
[ ] 是否提出了后续问题

每周知识库体检

[ ] 是否有孤立页面
[ ] 是否有重复概念
[ ] 是否有过时结论
[ ] 是否有无来源断言
[ ] 是否有重要概念缺页
[ ] 是否有页面没有被 Index 收录
[ ] 是否有 Inbox 长期未处理
[ ] 是否有值得继续研究的问题

发布文章前检查

[ ] 是否有明确观点
[ ] 是否不只是资料摘要
[ ] 是否有自己的判断
[ ] 是否包含可执行步骤
[ ] 是否删除了内部草稿痕迹
[ ] 是否保留了必要来源
[ ] 是否适合公开发布

十一、推荐工具组合

刚开始只需要:

Obsidian
LLM Agent
Markdown 文件夹

进阶后可以加入:

Obsidian Web Clipper
Git
Dataview
Marp
本地 Markdown 搜索工具

Karpathy 原文也提到,Obsidian Web Clipper 适合把网页转成 Markdown,Graph View 适合观察 Wiki 结构,Dataview 可以根据 YAML frontmatter 生成动态表格,Marp 可以从 Markdown 生成演示文稿,而整个 Wiki 本质上就是一个由 Markdown 文件组成的 Git 仓库。(Gist)

强烈建议给 Obsidian Vault 加 Git:

git init
git add .
git commit -m "Initial Obsidian LLM Wiki"

这样可以查看 LLM 修改了什么,也可以随时回滚。


十二、从零开始的最小行动方案

不要一开始就做复杂系统。

第一周只做这几件事。

第一天:建立目录

00_Inbox/
01_Raw/
02_Sources/
03_Concepts/
04_Entities/
05_Syntheses/
06_Questions/
07_Comparisons/
90_Index/
99_System/

第二天:摄入 3 篇真正重要的文章

不要批量导入几百篇资料。

先选 3 篇你真正关心的文章,逐篇执行 ingest。

第三天:生成第一篇 synthesis

提示词:

请基于最近摄入的 3 篇文章,生成一篇综合分析:

主题:我目前对个人知识管理的理解

请保存到:
05_Syntheses/我的个人知识管理方法.md

并更新 Index 和 Log。

第四天:提出 3 个重要问题

例如:

什么样的资料值得进入我的 Obsidian?
如何避免 Obsidian 变成资料坟场?
如何用 Obsidian 支持长期写作?

把答案保存到 06_Questions/

第五天:做第一次 Lint

让 LLM 检查:

重复页面
孤立页面
缺失链接
Index 是否完整
Log 是否完整

第六天:优化 AGENTS.md

根据实际使用情况,调整规则。

第七天:写第一篇网站文章

05_Syntheses/ 中选一个主题,让 LLM 生成一篇可发布文章。

个人知识库的价值,不是“我存了多少”,而是“我能输出什么”。


十三、最重要的经验

第一,不要把 Obsidian 当收藏夹。收藏不是知识管理,整理、链接、综合和输出才是。

第二,不要只让 LLM 总结文章。更好的问题是:这篇文章改变了哪些已有观点?应该更新哪些概念页?和哪些笔记冲突?能补充哪个 synthesis?

第三,人负责判断,LLM 负责维护。人选择资料、提出问题、判断价值;LLM 负责摘要、链接、归档、更新和检查。

第四,重要回答必须沉淀。不要让有价值的问答消失在聊天记录里,要保存到 06_Questions/05_Syntheses/

第五,定期清理比持续添加更重要。知识库真正失控,不是因为资料少,而是因为没人维护结构。


十四、总结

Andrej Karpathy 在《LLM Wiki》中提出的真正价值,不是某个具体工具,而是一种新的知识工作方式:

让 LLM 不只是回答问题,而是持续维护一个能积累、能更新、能交叉引用、能暴露矛盾的个人知识系统。

原文链接:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

对 Obsidian 用户来说,这个思路非常适合落地。

最终工作流可以概括为:

资料进入 00_Inbox/
原文归档到 01_Raw/
LLM 创建 02_Sources/
LLM 更新 03_Concepts/
重要问答进入 06_Questions/
综合判断进入 05_Syntheses/
90_Index/ 保持可导航
99_System/Log.md 保持可追踪
定期 Lint 保持健康
最终输出文章、报告、决策和洞察

这不是一个“AI 总结文章”的技巧。

这是把 Obsidian 从笔记软件升级为个人知识操作系统的方法。

Obsidian 是知识库。

LLM 是维护员。

人是判断者。

当这三者配合起来,个人知识管理才真正开始产生复利。