Karpathy 三层知识库:视频配套手册
本手册对应的是一套已经落地为技能包的三层知识库体系。系统目标不是把资料堆进一个检索容器,而是在原始资料与每次提问之间建立一层可持续维护的知识中间层,使知识以页面、链接、索引和日志的形式持续沉淀。
来自视频:Karpathy三层结构,我搭了套会生长的WIKI知识库!
1. 定位
本手册对应的是一套已经落地为技能包的三层知识库体系。系统目标不是把资料堆进一个检索容器,而是在原始资料与每次提问之间建立一层可持续维护的知识中间层,使知识以页面、链接、索引和日志的形式持续沉淀。
2. 三层结构
2.1 Raw sources/
该层保存原始资料与证据,包括文章、论文、书摘、仓库文档、数据、音视频转写、截图与附件。该层的原则是保留原始表达,尽量只增不改。
2.2 The wiki/
该层保存维护后的理解,是系统的主要工作层。这里承载来源解读、概念页、人物页、项目页、问题页、对比页与综合页。未来的回答、选题、写作和复盘,应优先建立在这一层之上。
2.3 The schema/
该层保存规则、模板与入口文件,用于约束目录命名、页面分类、更新方式和维护动作。该层决定系统是否能长期稳定运行。
3. 标准目录
当前规范采用以下固定名称:
Raw sources/
The wiki/
The schema/
其中必须存在以下入口文件:
The schema/AGENTS.mdThe wiki/index.mdThe wiki/log.md
不再使用旧别名 raw/、wiki/、schema/ 作为正式目录名。
4. 技能包组成
当前体系已经沉淀为四个可复用技能:
three-layer-vault:总控技能,负责脚手架、维护与跨动作协调。three-layer-vault-ingest:负责把新资料纳入系统。three-layer-vault-query:负责围绕现有 wiki 回答问题,并在结果具备复用价值时回写。three-layer-vault-lint:负责结构检查、命名漂移检查与维护缺口检查。
这四个技能共同覆盖 scaffold、ingest、query、lint 四个核心动作。
5. 四个核心动作
5.1 Scaffold
初始化时应直接建立三层目录、入口文件、模板与最小导航,不追求复杂功能,优先保证结构清晰、命名统一、后续可维护。
5.2 Ingest
一次正式 ingest 必须完成以下动作:
- 将资料放入
Raw sources/的正确位置。 - 在
The wiki/source-notes/创建或更新来源解读页。 - 提炼可复用判断,并更新相关 canonical notes。
- 刷新
The wiki/index.md。 - 在
The wiki/log.md追加一条 ingest 记录。
只生成一篇摘要而不更新 wiki 图谱,不算完成 ingest。
5.3 Query
query 的默认起点是 The wiki/,不是直接从原始资料堆里临时拼答案。回答完成后,应判断结果是否具备长期价值。若具备,应以最小合适形式回写为 questions/、concepts/、comparisons/ 或 syntheses/ 页面,并在必要时更新 index 与 log。
5.4 Lint
lint 用于定期检查系统是否仍然健康,重点包括目录是否完整、旧命名是否残留、页面 frontmatter 是否缺失、source note 是否回链到原始资料、是否存在重复概念、是否存在应写回而未写回的 durable outputs。
6. 页面与维护规则
Raw sources/保存证据,不承担总结职能。The wiki/保存解释、判断与结构化理解。- 优先更新已有 canonical note,而不是制造近义重复页。
The wiki/index.md是内容导航,不是摆设。The wiki/log.md是系统记忆,保持追加式记录。- schema 需要随工作流一起迭代,不是一次性说明书。
7. 最小运行要求
建议至少具备以下环境:
- 一个可直接改本地文件的 Agent,例如 Codex。
- 一个 markdown 工作区,例如 Obsidian。
- Git 或其他版本管理能力。
若要快速启动,可直接复用当前 skill 包中的 starter vault,再按主题逐步扩展资料与页面。
8. 完成标准
一套三层知识库达到可用状态,至少应满足以下条件:
- 三层目录与入口文件齐全。
- 已完成至少一次完整 ingest。
- 已完成至少一次基于 wiki 的 query。
- 已完成至少一次 lint。
- index 能导航主要页面,log 能回放近期动作。
9. 常见偏差
- 把 wiki 做成摘要仓库,而不是判断层。
- 一次性导入过多资料,导致命名和分类失控。
- 允许 Agent 直接改写 raw,破坏证据层。
- 只回答问题,不把 durable results 回写。
- 缺失 index 和 log,导致系统无法导航和追溯。
10. 结论
Karpathy 这套方法的关键,不是增加一个笔记软件,也不是再做一层普通 RAG,而是明确分离证据层、理解层与规则层,并通过 skills 把 ingest、query、lint 变成稳定、可重复、可维护的动作。系统一旦跑通,AI 参与的就不再只是即时问答,而是知识结构本身的持续维护。

