docs: 添加通俗的逻辑架构说明 + mermaid 流程图

2026-05-15 22:30:38 +08:00 · 2026-03-24 16:49:20 +08:00
parent 95cde04e64
commit 0ebfbb6086
1 changed files with 69 additions and 0 deletions
--- a/README.md
+++ b/README.md
@@ -18,6 +18,75 @@
 ---
 ## 🧭 它是怎么工作的
 整个插件可以拆成三件事：**写入**（把对话变成记忆）、**读取**（把记忆送回给 AI）、**安全**（出了问题能恢复）。
 ```mermaid
 flowchart LR
    subgraph 写入["✏️ 写入：对话 → 记忆"]
        A["AI 回复了一条消息"] --> B["提取器读取最近几轮对话"]
        B --> C["让 LLM 识别出角色/事件/地点等"]
        C --> D["对比已有记忆，去重或更新"]
        D --> E["写入图谱 + 同步向量"]
    end
    subgraph 读取["🔍 读取：记忆 → 注入"]
        F["用户准备发送下一条"] --> G["用向量搜索找相关记忆"]
        G --> H["沿关系网络扩散，发现关联"]
        H --> I["综合打分排序"]
        I --> J["格式化后注入 prompt"]
    end
    subgraph 安全["🛡️ 安全：历史变动 → 恢复"]
        K["用户删楼/编辑/切 swipe"] --> L["检测到哪些楼层变了"]
        L --> M["回滚受影响的记忆和向量"]
        M --> N["从变动点重新提取"]
    end
    E -.-> F
    N -.-> E
 ```
 ### 写入阶段（对话 → 记忆）
 每次 AI 回复后，插件会把最近几轮对话打包发给 LLM（可以是你聊天用的同一个模型，也可以单独配一个），让它识别出"这段对话里出现了哪些角色、发生了什么事、在哪里、有什么新规则"等等。
 识别出来的结果不是直接塞进去——插件会先跟已有记忆做对比（通过向量搜索找相似的），如果已经有了就更新，如果是真正的新内容才创建。
 写入之后，还可能触发一些后续处理：
 - **压缩** — 太多类似的事件记忆会被合并
 - **进化** — 新信息会影响旧记忆的理解（比如"原来他当时是在演戏"）
 - **概要** — 自动生成"之前发生了什么"的总结
 - **遗忘** — 很久没被用到的记忆降低优先级
 ### 读取阶段（记忆 → 注入）
 当你准备发送下一条消息时，插件会抢在 AI 生成之前做一轮"召回"：
 1. **向量搜索** — 根据当前对话内容，用 Embedding 找到语义最相关的记忆
 2. **图扩散** — 找到相关记忆后，沿着关系往外扩散（比如某个角色参与了某个事件，那个事件发生在某个地点...）
 3. **混合评分** — 把向量相似度、图扩散能量、节点重要性、时间新旧综合排序
 4. **格式化注入** — 选出最终入围的记忆，分类整理后注入到 prompt 里
 注入的内容分成两层：
 - **常驻层** — 规则、概要、主线这类始终需要的
 - **动态层** — 根据当前对话语境召回的
 ### 安全机制（历史变动 → 恢复）
 这是很多记忆插件忽略的问题：如果用户删了某条消息、编辑了内容、或者切了 swipe，已经基于那条消息提取的记忆就变成"脏"的了。
 ST-BME 的处理方式是：
 1. 给每条已处理的消息计算 hash（指纹）
 2. 发现 hash 变了 → 找到最早受影响的位置
 3. 把那之后产生的记忆和向量全部回滚
 4. 从变动点重新走一遍提取流程
 如果恢复日志损坏了，会退化为全量重建——慢一点但保证正确。
 ---
 ## 🚀 安装
 ### 方法一：通过 SillyTavern 扩展安装