跳到主要内容

LLM Wiki

LLM Wiki 是个人站点背后的知识编译层。 它不替代 RAG,不替代个人站点,而是把原始资料、个人思考、外部信息持续整理成一个由 LLM 维护、由人校准的结构化 wiki。这层 wiki 不直接对外发布,但它让写文章、做决策、回答高价值问题都有现成的素材和索引。


核心思路

传统 RAG 是在提问时临时检索资料:

资料 → 切 chunk → 向量索引 → 提问 → 检索片段 → LLM 拼答案

LLM Wiki 是在平时就把资料整理成可复用的知识单元:

资料 → LLM 阅读 → 提炼概念、实体、主题、关系 → 写成 wiki 页面 → 页面互链
→ 新资料持续更新旧页面 → 查询时基于 wiki 综合回答 → 高价值答案再沉淀回 wiki

区别不在检索技术,而在谁负责把知识组织好。RAG 把组织工作推给检索时刻的临时拼接,LLM Wiki 把组织工作前移到平时的结构化沉淀。两者可以叠加:wiki 自身的索引也可以走 RAG。


三层结构

LLM Wiki 由三个独立层组成,每层解决不同问题。

第一层:原始资料(raw)。这一层保存事实来源,包括文章、论文、网页、会议纪要、PDF、读书笔记、碎片思考。原则是只存不改,任何整理动作都在上层完成,原始层永远可回溯。

第二层:Wiki 页面(wiki)。这一层是 LLM 维护的结构化 Markdown 页面,按页面类型组织:

  • index.md 总索引
  • log.md 更新日志
  • sources/xxx.md 单篇资料摘要
  • concepts/xxx.md 概念页(定义、背景、攻防/防御/应用、与其他概念关系)
  • entities/xxx.md 实体页(公司、人物、产品)
  • synthesis/xxx.md 综合分析页(跨资料结论)
  • comparisons/xxx.md 对比页
  • questions/xxx.md 高价值问题沉淀

这一层不是"读完写一段话",而是要把资料拆成可长期复用的最小知识单元,让一个概念出现一次、被引用多次。

第三层:Schema 规则(schema)。这一层定义 LLM 如何维护 wiki:什么类型的内容生成什么页面,概念页包含哪些字段,新资料进来时执行哪些动作,引用怎么标,矛盾怎么处理,重复如何合并。没有 schema,LLM 只是随手写笔记;有了 schema,LLM 才像知识库维护员。


关键流程

Ingest(导入) 是 wiki 的主入口。新增一篇资料时,LLM 不只生成摘要,而是按 schema 执行一组维护动作:

读取资料 → 生成 source 页面 → 提取关键概念 → 判断已有概念页是否需要更新
→ 创建新概念页 → 更新 synthesis 页建议 → 更新 index → 记录 log → 标记冲突

一篇关于 Agent 安全的文章可能同时更新多个概念页和综合分析页,而不是只产出一份摘要。

Query(查询) 不直接做全文检索,而是先查 index 找到相关概念页和综合页,再综合回答:

理解问题 → 查 index → 找相关 concept / synthesis / source 页面 → 综合回答
→ 如果答案有长期价值,再沉淀成新 wiki 页面

Lint(体检) 决定知识库能不能长期复利。定期检查孤立页面、重复概念、过期观点、互相矛盾、index 覆盖度、过长/过碎的页面。这一步比前两步更关键——没有 lint,再多积累也只是垃圾堆。


和当前个人站点的关系

当前个人站点的沉淀路径是:

输入 → 人工理解 → 写成文章 → 发布

LLM Wiki 引入后的路径是:

输入 → LLM 结构化 → wiki 持续演化 → 人工判断 → 精选成文章 / 方法论 / 决策依据

二者不是替代,是上下游分工

层级作用公开性维护方式
原始资料事实来源私有人工收集
LLM Wiki结构化知识资产半公开/私有LLM 维护,人审核
个人站点长期作品与方法论公开人主导,LLM 辅助

关键原则:

  • 不要让 LLM 决定什么可以公开。
  • 不要把 wiki 页面直接当文章发布。
  • 不追求一开始全自动。
  • 一个主题跑通闭环,再扩展到其他主题。
  • wiki 服务于长期写作、研究和决策,不是终点。

LLM Wiki 真正解决的问题是个人知识系统能否长期复利。单次写作节省的时间不重要;持续累积下来,wiki 让旧资料能反向更新旧观点、让新思考能基于已有结构、让高价值问题不再从零回答,才是有价值的部分。


落地步骤

不要一开始改造所有知识库。

第一步:选一个高价值主题试点。 适合的主题特征是资料更新快、概念多、和当前工作强相关、能产出公开文章。AI 安全、Agent 框架、特定行业研究都是典型候选。

第二步:建立最小 wiki 骨架。 创建 index.md / log.md / schema.md 三个核心文件,加 sources/ / concepts/ / synthesis/ 三个子目录。schema.md 先只定义 source、concept、synthesis 三种页面类型的最小字段。

第三步:用半自动方式跑通一次闭环。 选 10 篇资料手工或半自动地走一遍 ingest 流程,重点观察 schema 是否真的能约束 LLM 输出、概念页是否能被复用、index 是否方便查找。不要先写程序,先把人和 LLM 的协作节奏跑顺。

第四步:从 wiki 提炼第一篇公开文章。 这次提炼才是真正验证 wiki 价值的时刻——如果 wiki 里的概念页、综合页无法支撑一篇有深度的文章,说明结构还需要调整;如果可以,wiki 才真正成为个人站点的素材库。

第五步:把 lint 排上日程。 没有 lint 就没有长期复利。固定周期(每周或每月)跑一次检查:孤立页面、重复概念、过期观点、index 覆盖度。

落地之后,wiki 不是"另一个文档系统",而是个人站点的预编译层。个人站点从此可以专注于精选和表达,不必再从零组装结构化思考。


相关

  • Skill:把经验、流程、判断标准沉淀为可复用资产,wiki 概念页本身可以视作一类 Skill。
  • Chat 与 Research:查询阶段的提问与上下文设计,wiki 让研究不再是临时检索。
  • AI 编程:wiki schema 可以用版本化 Markdown 维护,文档生成和 lint 都可以借助 AI Coding 工具。