一个 Prompt + 工具清单，搭建 Karpathy 本地知识库¶

把工具清单和 Prompt 直接复制发给你的 Claude Code / Codex 就能开搭

小红书一个命令和工具清单实现Karpathy本地知识库

把工具清单和 Prompt 直接复制发给你的 Claude Code / Codex 就能开搭

294 650

📐 架构：就三层¶

① 原始资料层（只读，LLM 不改）

你的论文、文章、笔记、截图、网页剪藏。

② Wiki 层（LLM 写和维护，你只看）

结构化的 Markdown 文件：摘要、卡片、索引、综述，全部自动生成。

③ Schema 层（告诉 LLM 怎么干活）

一个 CLAUDE.md 或 AGENTS.md，写清楚目录结构、命名规范、工作流程。

🔧 工具清单：按层拆解¶

资料采集¶

工具	干嘛的	门槛
Obsidian Web Clipper	浏览器一键把网页变成 Markdown	装插件就行
Jina Reader（`r.jina.ai`）	任意 URL → 干净 Markdown，LLM 直接能读	免费 API
Zotero	学术党必备，论文管理 + 一键导出 BibTeX	免费
Readwise	把 Kindle / 微信读书 / Pocket 的标注自动同步到本地	付费
MarkDownload	另一个网页转 Markdown 的浏览器扩展	免费
微信输入法语音转文字	随手录想法，复制到笔记里	自带

知识库 IDE（你看 wiki 用的）¶

工具	干嘛的	门槛
Obsidian	本地 Markdown 编辑器，图谱视图能看知识连接	免费，核心推荐
obsidian-cli	让 Agent 通过命令行操作 Obsidian	`brew install obsidian-cli`
Obsidian Dataview 插件	在笔记上跑查询，比如按标签列出所有论文	装插件
Obsidian Marp 插件	Markdown 直接生成幻灯片	装插件
Logseq	Obsidian 的替代品，大纲式组织，也是本地 Markdown	免费

LLM Agent（帮你写和维护 wiki 的）¶

工具	特点	适合谁
Claude Code	最稳，读写本地文件无障碍，适合单人 wiki	有 API key 就行
Codex (OpenAI)	适合顺序执行，配合 AGENTS.md	类似
OpenClaw	开源本地 Agent，支持多 Agent 编排 + 浏览器自动化	折腾党
Cursor / Windsurf	代码编辑器但也能操作 Markdown 文件	已经在用的
Aider	开源命令行 AI 编程助手，也能管 Markdown 仓库	极客

搜索和索引¶

工具	干嘛的	门槛
qmd	本地 Markdown 语义搜索，BM25 + 向量混合	`npm install -g @tobilu/qmd`
Ollama + Embedding 模型	本地跑向量化，配合 qmd 使用	需要 8G+ 内存
ripgrep (`rg`)	极速全文搜索，Agent 的 grep 神器	`brew install ripgrep`
fzf	模糊搜索，快速定位文件	`brew install fzf`

📋 复制这段给你的 Agent¶

把上面的工具清单和下面的 Prompt 直接发给你的 Claude Code 或 Codex：

你是我的个人知识库管理员。请帮我在本地搭建一个 LLM Wiki 系统。

## 架构

三个目录：
- raw/        → 原始资料（你只读不改）
- wiki/       → 你生成并维护的 Markdown 知识库
- CLAUDE.md   → 工作规范（我们一起写）

## Wiki 结构

wiki/
├── index.md          ← 所有页面的目录（每页一行：链接 + 一句话摘要）
├── log.md            ← 操作日志（## [日期] 操作类型 | 标题）
├── concepts/         ← 概念页（每个重要概念一个 .md）
├── entities/         ← 实体页（人物、项目、公司、工具）
├── sources/          ← 每个原始资料的摘要页
└── outputs/          ← 查询产出（综述、对比表、分析）

## 核心工作流

### 摄入（Ingest）
当我把新文件放进 raw/ 并告诉你处理时：
1. 读原文，和我讨论要点
2. 在 sources/ 写一页摘要
3. 更新 index.md
4. 更新所有相关的 concepts/ 和 entities/ 页面
5. 在 log.md 追加记录
一个资料可能涉及 10-15 个页面的更新。

### 查询（Query）
当我问问题时：
1. 先读 index.md 找到相关页面
2. 深入阅读这些页面
3. 综合回答，引用具体页面
4. 如果回答有价值，存为 outputs/ 下的新页面，更新 index.md

### 健康检查（Lint）
定期检查：
- 页面之间有没有矛盾
- 有没有孤立页面（没有任何链接指向它）
- 有没有提到但还没建页面的概念
- 有没有过时信息可以用新资料更新

## 规范
- 所有文件用 Markdown
- 页面之间用 [[wiki-links]] 互相引用
- 每个页面开头有 YAML frontmatter（tags, date, sources）
- index.md 按类别组织，每次摄入都更新
- log.md 每条格式：## [YYYY-MM-DD] ingest/query/lint | 标题

先帮我创建这个目录结构和一个空的 index.md + log.md。
然后阅读工具清单并根据我的本地电脑信息，选择适配的工具。
最后告诉我怎么开始，采取问答式协同工作。

💡 进阶玩法¶

个人日记编译：把日记、Apple Notes、聊天记录扔进 raw/，LLM 自动提取你的偏好、习惯、目标，生成"关于我"的 wiki（Farza 做的 Farzapedia 就是这个思路）
读书笔记：每读一章扔进去，LLM 自动维护角色页、主题页、时间线，读完你就有了一个私人 fan wiki
Finetuning：当 wiki 大到一定程度，可以用它微调一个开源模型，让 AI 把你的知识"记在权重里"而不只是"读你的文件"

🎯 核心原则¶

你的数据在你本地，不在任何 AI 公司的服务器上
纯 Markdown + 文件，任何工具都能读，任何 AI 都能用
换 AI 不丢数据——今天用 Claude，明天用 GPT，后天用开源模型，wiki 还是你的
人负责方向，机器负责跑腿

必装 4 个工具¶

工具	作用
Obsidian	知识库本体，没它看不了 wiki
Claude Code	写入和维护（其他 agent 也可）
ripgrep	CC 搜索和 lint 的底层命令
Git	wiki 版本控制

按需安装：

Obsidian Web Clipper：网页转 Markdown
marker-pdf：有 PDF 需求时安装
Pandoc：对外导出多格式
qmd：wiki 内容积累到几百篇后再安，现在 rg 够用