Files
ST-Bionic-Memory-Ecology/docs/usage/configuration.md

217 lines
7.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 主要配置
**中文** · [English](configuration.en.md)
本文从 [README](../../README.md) 拆出 ST-BME 的主要用户配置说明,保留设置名称、默认值和表格,便于按功能查阅。
### 界面语言
`界面语言` 只影响 ST-BME 前端 UI面板、菜单入口、悬浮按钮、状态、Toast、召回卡片和图谱系统标签。
可选值:
- `自动`:优先跟随 SillyTavern / 浏览器语言,识别不到时使用中文。
- `简体中文`:固定中文界面。
- `English`:固定英文界面。
这个设置**不会**翻译聊天内容、用户输入、AI 回复、记忆节点、召回注入文本或提示词构建。切换语言不会改变记忆图谱和模型行为。
### 记忆 LLM
记忆 LLM 用于:
- 提取记忆。
- 召回精排。
- 整合。
- 压缩。
- 小总结。
- 总结折叠。
- 反思。
- ENA Planner 规划。
配置方式:
- **留空**
- 复用当前 SillyTavern 聊天模型。
- **填写 OpenAI-compatible 配置**
- 使用独立模型处理记忆任务。
- 适合把主聊天模型和后台维护模型分开。
安全建议:
- 不要把包含 API Key 的 `extension_settings` 或浏览器存储导出后公开。
- 调试日志默认关闭,需要排障时再临时开启。
### Embedding
Embedding 是智能召回的核心。
#### 后端模式
推荐优先使用后端模式:
- 复用 SillyTavern 后端的 embedding provider。
- 通常不需要浏览器直接持有 embedding API Key。
- 可使用 SillyTavern 已支持的 OpenAI、Cohere、Mistral、Ollama、LlamaCpp、vLLM 等来源。
#### 直连模式
直连模式由浏览器直接请求 embedding 服务:
- 需要填写 API 地址、Key 和模型。
- 可能遇到 CORS 限制。
- 适合自建网关或独立 embedding 服务。
> 切换 embedding 模式或模型后,建议执行“重建向量”。
### 提取设置
| 设置 | 默认 | 说明 |
| --- | --- | --- |
| 每 N 条回复提取 | `1` | 每几条助手回复触发一次提取 |
| 提取上下文轮数 | `2` | 提取时向前看的对话轮数 |
| 自动延后最新助手 | `false` | 可让最新回复稳定后再提取 |
| Assistant 排除标签 | `think,analysis,reasoning` | 默认排除推理标签 |
| 提取消息上限 | `0` | `0` 表示不限 |
| 提取 Prompt 结构模式 | `both` | 同时提供 transcript 和 structured messages |
| 提取世界书模式 | `active` | 复用当前激活世界书上下文 |
| 包含故事时间 | `true` | 提取时提供故事时间线 |
| 包含总结快照 | `true` | 提取时提供活跃总结 |
| 手动提取模式 | `pending` | 面板中的提取模式默认值 |
### 召回设置
| 设置 | 默认 | 说明 |
| --- | --- | --- |
| 启用召回 | `true` | 生成前自动检索记忆 |
| 向量预筛 | `true` | 先用 embedding 找候选 |
| 图扩散 | `true` | 沿图关系扩散相关节点 |
| LLM 精排 | `true` | 让 LLM 从候选中筛最终结果 |
| 召回 Top-K | `20` | 向量预筛数量 |
| 最终节点上限 | `12` | 注入前最多保留节点数 |
| 图扩散 Top-K | `100` | 图扩散候选数量 |
| LLM 候选池 | `30` | 进入精排的候选池大小 |
| 多意图拆分 | `true` | 一条输入拆成多个检索意图 |
| 上下文混合查询 | `true` | 融合当前输入、上一轮助手、前一条用户消息 |
| 词法增强 | `true` | 关键词精确匹配加权 |
| 时序链接 | `true` | 临近时间节点互相增强 |
| 多样性采样 | `true` | 避免召回结果过于同质 |
### 认知与空间设置
| 设置 | 默认 | 说明 |
| --- | --- | --- |
| Scoped Memory | `true` | 启用作用域记忆 |
| POV Memory | `true` | 启用角色/用户视角记忆 |
| 区域目标 | `true` | 区分当前区域、邻接区域、全局 |
| 认知记忆 | `true` | 启用主客观认知归属 |
| 空间邻接 | `true` | 地区之间可建立邻接关系 |
| 故事时间线 | `true` | 启用故事时间标签 |
| 注入故事时间标签 | `true` | 在注入中提示当前故事时间 |
| 软时间引导 | `true` | 以提示方式引导,不强制改写 |
### 维护设置
| 设置 | 默认 | 说明 |
| --- | --- | --- |
| 启用整合 | `true` | 相似/冲突记忆分析与合并 |
| 整合阈值 | `0.85` | 相似度触发阈值 |
| 启用小总结 | `true` | 兼容旧 `synopsis` 名称 |
| 启用层级总结 | `true` | 使用小总结 + 折叠的总结体系 |
| 小总结频率 | `3` | 每几次提取生成小总结 |
| 总结折叠扇入 | `3` | 同层总结达到几条后折叠 |
| 启用智能触发 | `false` | 只在高信息量场景增强提取 |
| 启用主动遗忘 | `false` | 周期性降低低价值节点 |
| 启用概率召回 | `false` | 少量弱相关记忆按概率入围 |
| 启用反思 | `true` | 周期性总结长期趋势 |
| 启用自动压缩 | `true` | 按提取周期压缩同类记忆 |
### 任务预设与正则清理
任务预设类型:
- **`extract`**
- 记忆提取。
- **`recall`**
- 召回精排。
- **`compress`**
- 记忆压缩。
- **`synopsis`**
- 小总结生成。
- **`summary_rollup`**
- 总结折叠。
- **`reflection`**
- 长期反思。
- **`consolidation`**
- 记忆整合。
- **`planner`**
- ENA Planner 规划。
正则清理用于减少污染标签进入提取、召回和注入:
- `thinking` / `think` / `analysis` / `reasoning`
- `choice`
- `UpdateVariable`
- `status_current_variable`
- `StatusPlaceHolderImpl`
用户可以在“任务预设”中调整全局正则和任务局部规则。显式保存为空规则时,插件不会自动把默认规则加回去。
### ENA Planner
ENA Planner 现在通过 `planner` 任务预设接入。更深入的实现与流程说明见 [ENA Planner 功能文档](../features/ena-planner.md)。它可以使用:
- 角色卡块。
- 世界书块。
- 最近聊天块。
- BME 召回记忆块。
- 历史 `<plot>` 块。
- 当前玩家输入块。
建议:
- 在“配置 → ENA 规划器”中配置基础 API 和启用状态。
- 在“配置 → 任务预设 → planner”中调整规划 prompt 结构和生成参数。
### 隐藏旧楼层与渲染限制
这是两个不同功能;更深入的实现与边界说明见 [隐藏旧楼层与渲染限制功能文档](../features/hide-and-render.md)
- **隐藏旧楼层**
- 用于控制上下文 token。
- 不删除聊天内容。
- 通过酒馆隐藏机制让较早楼层不再参与主回复和 ST-BME 读取。
- **限制聊天区渲染楼层**
- 用于减少超长聊天界面卡顿。
- 同步到 SillyTavern 的 `chat_truncation`
- 只控制前端最多加载最近多少条。
- 不等于上下文隐藏,也不等于删除消息。
重要提示:
- 如果你要对很早的楼层做“重新提取范围”或完整历史恢复,建议临时关闭渲染限制或调大数量并刷新。
- 当 ST-BME 检测到当前 `context.chat` 很可能只是最近 N 条渲染切片时,会暂停破坏性历史恢复,避免误清空运行时图谱。
### Native 性能加速
Native 加速目前是灰度能力,更深入的实现与回退策略见 [Native 性能加速功能文档](../features/native-acceleration.md),覆盖:
- 图布局。
- Persist Delta。
- 快照 Hydrate。
默认策略:
- 按节点、边、记录数、结构变化和序列化体积阈值自动命中。
- `Fail-open` 默认开启Native 不可用或失败时回退 JS。
- 可以通过“全局强制关闭 Native”统一回退 JS。