LLM Wiki

LLM Wiki 是个人站点背后的知识编译层。 它不替代 RAG，不替代个人站点，而是把原始资料、个人思考、外部信息持续整理成一个由 LLM 维护、由人校准的结构化 wiki。这层 wiki 不直接对外发布，但它让写文章、做决策、回答高价值问题都有现成的素材和索引。

核心思路

传统 RAG 是在提问时临时检索资料：

资料 → 切 chunk → 向量索引 → 提问 → 检索片段 → LLM 拼答案

LLM Wiki 是在平时就把资料整理成可复用的知识单元：

资料 → LLM 阅读 → 提炼概念、实体、主题、关系 → 写成 wiki 页面 → 页面互链
      → 新资料持续更新旧页面 → 查询时基于 wiki 综合回答 → 高价值答案再沉淀回 wiki

区别不在检索技术，而在谁负责把知识组织好。RAG 把组织工作推给检索时刻的临时拼接，LLM Wiki 把组织工作前移到平时的结构化沉淀。两者可以叠加：wiki 自身的索引也可以走 RAG。

三层结构

LLM Wiki 由三个独立层组成，每层解决不同问题。

第一层：原始资料（raw）。这一层保存事实来源，包括文章、论文、网页、会议纪要、PDF、读书笔记、碎片思考。原则是只存不改，任何整理动作都在上层完成，原始层永远可回溯。

第二层：Wiki 页面（wiki）。这一层是 LLM 维护的结构化 Markdown 页面，按页面类型组织：

index.md 总索引
log.md 更新日志
sources/xxx.md 单篇资料摘要
concepts/xxx.md 概念页（定义、背景、攻防/防御/应用、与其他概念关系）
entities/xxx.md 实体页（公司、人物、产品）
synthesis/xxx.md 综合分析页（跨资料结论）
comparisons/xxx.md 对比页
questions/xxx.md 高价值问题沉淀

这一层不是"读完写一段话"，而是要把资料拆成可长期复用的最小知识单元，让一个概念出现一次、被引用多次。

第三层：Schema 规则（schema）。这一层定义 LLM 如何维护 wiki：什么类型的内容生成什么页面，概念页包含哪些字段，新资料进来时执行哪些动作，引用怎么标，矛盾怎么处理，重复如何合并。没有 schema，LLM 只是随手写笔记；有了 schema，LLM 才像知识库维护员。

关键流程

Ingest（导入） 是 wiki 的主入口。新增一篇资料时，LLM 不只生成摘要，而是按 schema 执行一组维护动作：

读取资料 → 生成 source 页面 → 提取关键概念 → 判断已有概念页是否需要更新
→ 创建新概念页 → 更新 synthesis 页建议 → 更新 index → 记录 log → 标记冲突

一篇关于 Agent 安全的文章可能同时更新多个概念页和综合分析页，而不是只产出一份摘要。

Query（查询） 不直接做全文检索，而是先查 index 找到相关概念页和综合页，再综合回答：

理解问题 → 查 index → 找相关 concept / synthesis / source 页面 → 综合回答
→ 如果答案有长期价值，再沉淀成新 wiki 页面

Lint（体检） 决定知识库能不能长期复利。定期检查孤立页面、重复概念、过期观点、互相矛盾、index 覆盖度、过长/过碎的页面。这一步比前两步更关键——没有 lint，再多积累也只是垃圾堆。

和当前个人站点的关系

当前个人站点的沉淀路径是：

输入 → 人工理解 → 写成文章 → 发布

LLM Wiki 引入后的路径是：

输入 → LLM 结构化 → wiki 持续演化 → 人工判断 → 精选成文章 / 方法论 / 决策依据

二者不是替代，是上下游分工：

层级	作用	公开性	维护方式
原始资料	事实来源	私有	人工收集
LLM Wiki	结构化知识资产	半公开/私有	LLM 维护，人审核
个人站点	长期作品与方法论	公开	人主导，LLM 辅助

关键原则：

不要让 LLM 决定什么可以公开。
不要把 wiki 页面直接当文章发布。
不追求一开始全自动。
一个主题跑通闭环，再扩展到其他主题。
wiki 服务于长期写作、研究和决策，不是终点。

LLM Wiki 真正解决的问题是个人知识系统能否长期复利。单次写作节省的时间不重要；持续累积下来，wiki 让旧资料能反向更新旧观点、让新思考能基于已有结构、让高价值问题不再从零回答，才是有价值的部分。

落地步骤

不要一开始改造所有知识库。

第一步：选一个高价值主题试点。 适合的主题特征是资料更新快、概念多、和当前工作强相关、能产出公开文章。AI 安全、Agent 框架、特定行业研究都是典型候选。

第二步：建立最小 wiki 骨架。 创建 index.md / log.md / schema.md 三个核心文件，加 sources/ / concepts/ / synthesis/ 三个子目录。schema.md 先只定义 source、concept、synthesis 三种页面类型的最小字段。

第三步：用半自动方式跑通一次闭环。 选 10 篇资料手工或半自动地走一遍 ingest 流程，重点观察 schema 是否真的能约束 LLM 输出、概念页是否能被复用、index 是否方便查找。不要先写程序，先把人和 LLM 的协作节奏跑顺。

第四步：从 wiki 提炼第一篇公开文章。 这次提炼才是真正验证 wiki 价值的时刻——如果 wiki 里的概念页、综合页无法支撑一篇有深度的文章，说明结构还需要调整；如果可以，wiki 才真正成为个人站点的素材库。

第五步：把 lint 排上日程。 没有 lint 就没有长期复利。固定周期（每周或每月）跑一次检查：孤立页面、重复概念、过期观点、index 覆盖度。

落地之后，wiki 不是"另一个文档系统"，而是个人站点的预编译层。个人站点从此可以专注于精选和表达，不必再从零组装结构化思考。

核心思路​

三层结构​

关键流程​

和当前个人站点的关系​

落地步骤​

相关​

核心思路

三层结构

关键流程

和当前个人站点的关系

落地步骤

相关