LLM Wiki
LLM Wiki 是个人站点背后的知识编译层。 它不替代 RAG,不替代个人站点,而是把原始资料、个人思考、外部信息持续整理成一个由 LLM 维护、由人校准的结构化 wiki。这层 wiki 不直接对外发布,但它让写文章、做决策、回答高价值问题都有现成的素材和索引。
核心思路
传统 RAG 是在提问时临时检索资料:
资料 → 切 chunk → 向量索引 → 提问 → 检索片段 → LLM 拼答案
LLM Wiki 是在平时就把资料整理成可复用的知识单元:
资料 → LLM 阅读 → 提炼概念、实体、主题、关系 → 写成 wiki 页面 → 页面互链
→ 新资料持续更新旧页面 → 查询时基于 wiki 综合回答 → 高价值答案再沉淀回 wiki
区别不在检索技术,而在谁负责把知识组织好。RAG 把组织工作推给检索时刻的临时拼接,LLM Wiki 把组织工作前移到平时的结构化沉淀。两者可以叠加:wiki 自身的索引也可以走 RAG。
三层结构
LLM Wiki 由三个独立层组成,每层解决不同问题。
第一层:原始资料(raw)。这一层保存事实来源,包括文章、论文、网页、会议纪要、PDF、读书笔记、碎片思考。原则是只存不改,任何整理动作都在上层完成,原始层永远可回溯。
第二层:Wiki 页面(wiki)。这一层是 LLM 维护的结构化 Markdown 页面,按页面类型组织:
index.md总索引log.md更新日志sources/xxx.md单篇资料摘要concepts/xxx.md概念页(定义、背景、攻防/防御/应用、与其他概念关系)entities/xxx.md实体页(公司、人物、产品)synthesis/xxx.md综合分析页(跨资料结论)comparisons/xxx.md对比页questions/xxx.md高价值问题沉淀
这一层不是"读完写一段话",而是要把资料拆成可长期复用的最小知识单元,让一个概念出现一次、被引用多次。
第三层:Schema 规则(schema)。这一层定义 LLM 如何维护 wiki:什么类型的内容生成什么页面,概念页包含哪些字段,新资料进来时执行哪些动作,引用怎么标,矛盾怎么处理,重复如何合并。没有 schema,LLM 只是随手写笔记;有了 schema,LLM 才像知识库维护员。
关键流程
Ingest(导入) 是 wiki 的主入口。新增一篇资料时,LLM 不只生成摘要,而是按 schema 执行一组维护动作:
读取资料 → 生成 source 页面 → 提取关键概念 → 判断已有概念页是否需要更新
→ 创建新概念页 → 更新 synthesis 页建议 → 更新 index → 记录 log → 标记冲突
一篇关于 Agent 安全的文章可能同时更新多个概念页和综合分析页,而不是只产出一份摘要。
Query(查询) 不直接做全文检索,而是先查 index 找到相关概念页和综合页,再综合回答:
理解问题 → 查 index → 找相关 concept / synthesis / source 页面 → 综合回答
→ 如果答案有长期价值,再沉淀成新 wiki 页面
Lint(体检) 决定知识库能不能长期复利。定期检查孤立页面、重复概念、过期观点、互相矛盾、index 覆盖度、过长/过碎的页面。这一步比前两步更关键——没有 lint,再多积累也只是垃圾堆。
和当前个人站点的关系
当前个人站点的沉淀路径是:
输入 → 人工理解 → 写成文章 → 发布
LLM Wiki 引入后的路径是:
输入 → LLM 结构化 → wiki 持续演化 → 人工判断 → 精选成文章 / 方法论 / 决策依据
二者不是替代,是上下游分工:
| 层级 | 作用 | 公开性 | 维护方式 |
|---|---|---|---|
| 原始资料 | 事实来源 | 私有 | 人工收集 |
| LLM Wiki | 结构化知识资产 | 半公开/私有 | LLM 维护,人审核 |
| 个人站点 | 长期作品与方法论 | 公开 | 人主导,LLM 辅助 |
关键原则:
- 不要让 LLM 决定什么可以公开。
- 不要把 wiki 页面直接当文章发布。
- 不追求一开始全自动。
- 一个主题跑通闭环,再扩展到其他主题。
- wiki 服务于长期写作、研究和决策,不是终点。
LLM Wiki 真正解决的问题是个人知识系统能否长期复利。单次写作节省的时间不重要;持续累积下来,wiki 让旧资料能反向更新旧观点、让新思考能基于已有结构、让高价值问题不再从零回答,才是有价值的部分。
落地步骤
不要一开始改造所有知识库。
第一步:选一个高价值主题试点。 适合的主题特征是资料更新快、概念多、和当前工作强相关、能产出公开文章。AI 安全、Agent 框架、特定行业研究都是典型候选。
第二步:建立最小 wiki 骨架。 创建 index.md / log.md / schema.md 三个核心文件,加 sources/ / concepts/ / synthesis/ 三个子目录。schema.md 先只定义 source、concept、synthesis 三种页面类型的最小字段。
第三步:用半自动方式跑通一次闭环。 选 10 篇资料手工或半自动地走一遍 ingest 流程,重点观察 schema 是否真的能约束 LLM 输出、概念页是否能被复用、index 是否方便查找。不要先写程序,先把人和 LLM 的协作节奏跑顺。
第四步:从 wiki 提炼第一篇公开文章。 这次提炼才是真正验证 wiki 价值的时刻——如果 wiki 里的概念页、综合页无法支撑一篇有深度的文章,说明结构还需要调整;如果可以,wiki 才真正成为个人站点的素材库。
第五步:把 lint 排上日程。 没有 lint 就没有长期复利。固定周期(每周或每月)跑一次检查:孤立页面、重复概念、过期观点、index 覆盖度。
落地之后,wiki 不是"另一个文档系统",而是个人站点的预编译层。个人站点从此可以专注于精选和表达,不必再从零组装结构化思考。
相关
- Skill:把经验、流程、判断标准沉淀为可复用资产,wiki 概念页本身可以视作一类 Skill。
- Chat 与 Research:查询阶段的提问与上下文设计,wiki 让研究不再是临时检索。
- AI 编程:wiki schema 可以用版本化 Markdown 维护,文档生成和 lint 都可以借助 AI Coding 工具。