diff --git a/.claude/plans/hide-host-system-decouple-plan.md b/.claude/plans/hide-host-system-decouple-plan.md
new file mode 100644
index 0000000..635a518
--- /dev/null
+++ b/.claude/plans/hide-host-system-decouple-plan.md
@@ -0,0 +1,441 @@
+# Hide / is_system 解耦与提取窗口收敛方案
+
+## 背景与用户真实诉求
+
+用户要解决的不是单点 bug，而是两个长期耦合问题：
+
+1. **自动隐藏旧楼层应只负责 `/hide` / `/unhide`**
+   - 不希望 BME 再本地改 `message.is_system`
+   - “重新应用当前隐藏”和“取消隐藏”也应收敛成 `/hide` / `/unhide`
+
+2. **BME 提取应按用户在“配置 -> 详细参数”里设置的上下文窗口读取**
+   - 目标参数是 `extractContextTurns`
+   - 主 AI 通过隐藏减少 token
+   - BME 仍能读到足够上下文，但不会无限读太多
+
+用户不希望继续出现以下情况：
+
+1. 隐藏状态影响 BME 是否能读到上下文
+2. 隐藏逻辑与历史恢复/提取逻辑继续共享 `is_system`
+3. 改掉一处后，另一处又因为 `is_system` 语义不清而出新 bug
+
+---
+
+## 这次梳理后的核心结论
+
+### 结论 1：宿主 ST 的 `/hide` 本身就会改底层消息对象的 `is_system`
+
+这个结论已经通过运行时实测确认：
+
+1. 隐藏前：普通 assistant 消息对象没有 `is_system`
+2. 手动执行 `/hide 6-6`
+3. 隐藏后：同一条消息出现 `is_system: true`
+
+这意味着：
+
+1. **不能把“去掉 BME 自己的 `is_system` 双写”当成最终解**
+2. 即使删掉 `hide-engine.js` 里的 `markManagedSystemRange` / `restoreManagedSystemFlags`
+3. 宿主 `/hide` 仍然会把普通历史消息变成 `is_system=true`
+
+因此，若 BME 提取链路继续按 `is_system` 过滤消息，用户的目标仍然无法实现。
+
+---
+
+### 结论 2：当前提取链路虽然已经部分松绑，但还没有真正完成“纯 `/hide`”
+
+当前代码状态：
+
+1. [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js)
+   - 已新增 `isBmeManagedHiddenMessage`
+   - 已新增 `isSystemMessageForExtraction`
+   - `getAssistantTurns`
+   - `buildExtractionMessages`
+   - `getChatIndexForPlayableSeq`
+   这些核心函数已经不再把 `extra.__st_bme_hide_managed === true` 的消息视为不可提取
+
+2. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js)
+   - `getSmartTriggerDecision` 相关路径已开始复用上述提取判定
+
+但问题在于：
+
+1. 这些改动目前只照顾到了 **BME 自己打了 `__st_bme_hide_managed` 标记** 的消息
+2. **宿主手动 `/hide`** 会直接把消息写成 `is_system=true`，但不会带 BME 标记
+3. 所以“真正的纯 `/hide` 设计”还没有完成
+
+换句话说：
+
+> 现在已经从“完全依赖 `is_system`”前进到了“BME 自己隐藏的消息可以继续提取”，但还没有前进到“凡是被 `/hide` 隐藏的普通楼层都能继续被 BME 按窗口读取”。
+
+---
+
+### 结论 3：宿主 `/hide` 大概率没有稳定附加标记，阶段 2 不应继续押注“找宿主字段”
+
+基于当前实测：
+
+1. 宿主手动 `/hide` 后，消息会新增 `is_system: true`
+2. 当前没有证据表明 `extra` 或其他 message 字段会稳定补充“这是 host hidden ordinary message”的标记
+
+因此，阶段 2 的主策略不应是：
+
+1. 继续猜测 `extra.hidden`
+2. 继续猜测宿主会补别的 message-level 标记
+
+更稳的策略应改为：
+
+1. **让 hide-engine 暴露“BME 当前管理的隐藏范围”查询能力**
+2. extraction 侧按 index 查询“这个楼层是否在 BME 管理隐藏范围内”
+3. 把“BME 自动隐藏的普通楼层”和“真正 system 消息”区分开
+
+这条策略的边界也要说清楚：
+
+1. 它优先解决的是**用户最初诉求里的“BME 自动隐藏旧楼层”**
+2. 它不自动等价于“宿主任意手动 `/hide` 的所有楼层都被 BME 当可提取消息”
+
+也就是说，第一轮落地目标应是：
+
+> 保证 BME 自己自动 `/hide` 的旧楼层不会再干扰 extraction，而不是一次性接管所有外部手动 `/hide` 场景。
+
+---
+
+### 结论 4：仍有若干非提取链路在按 `is_system` 过滤，但不应与本次目标混为一谈
+
+本次梳理中仍能看到这些位置：
+
+1. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js)
+   - `getLatestUserChatMessage`
+   - `getLastNonSystemChatMessage`
+
+2. [recall-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\recall-controller.js)
+   - `buildRecallRecentMessagesController` 仍跳过 `is_system`
+
+3. [recall-persistence.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\recall-persistence.js)
+   - `resolveGenerationTargetUserMessageIndex` 在 normal generation 下会跳过 `is_system`
+
+这些逻辑未必是 bug。它们更偏：
+
+1. recall / send-intent / prompt 注入输入整形
+2. 面向主 AI 可见聊天尾部，而不是 extraction 读取窗口
+
+所以不建议在“纯 `/hide` + extraction 去耦”阶段把 recall 逻辑一起大改。否则改动面会过大，容易把“主 AI 的可见上下文策略”和“BME 的提取上下文策略”混在一起。
+
+---
+
+## 现状问题图
+
+```mermaid
+flowchart TD
+  A["旧楼层被隐藏"] --> B["宿主 /hide 将普通消息写成 is_system=true"]
+  B --> C["如果 BME 仍按 is_system 过滤"]
+  C --> D["提取窗口读不到被隐藏楼层"]
+  D --> E["用户设置的 extractContextTurns 失去意义"]
+
+  A --> F["BME hide-engine 还会本地双写 is_system"]
+  F --> G["进一步加重隐藏系统与提取系统耦合"]
+```
+
+---
+
+## 已确认的代码位置
+
+### A. 当前仍在本地双写 `is_system` 的隐藏引擎
+
+[hide-engine.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\hide-engine.js)
+
+关键位置：
+
+1. `markManagedSystemRange`
+   - 直接写 `message.is_system = true`
+   - 写入 `extra.__st_bme_hide_managed = true`
+   - 同步 DOM `is_system` attribute
+
+2. `restoreManagedSystemFlags`
+   - 直接写回 `message.is_system = false`
+   - 删除 `extra.__st_bme_hide_managed`
+   - 同步 DOM `is_system` attribute
+
+### B. 当前提取窗口的核心入口
+
+[chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js)
+
+关键函数：
+
+1. `isAssistantChatMessage`
+2. `getAssistantTurns`
+3. `buildExtractionMessages`
+4. `getChatIndexForPlayableSeq`
+5. `getChatIndexForAssistantSeq`
+
+### C. 当前仍会影响提取/恢复批次推进的上层入口
+
+[extraction-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\extraction-controller.js)
+
+关键函数：
+
+1. `runExtractionController`
+2. `onManualExtractController`
+3. `onRerollController`
+4. `executeExtractionBatchController`
+
+### D. 当前“读取窗口配置”的用户入口
+
+[panel.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\panel.js)
+
+关键字段：
+
+1. `bme-setting-extract-context-turns`
+2. `settings.extractContextTurns`
+
+这说明用户最初说的“BME 读取用户自己设置的 N 楼层”并不是新概念，代码里已经有配置入口；问题在于提取链路还没有完全摆脱 `is_system` 对窗口的干扰。
+
+---
+
+## 设计判断
+
+### 判断 1：不要再把 `is_system` 当成 extraction 的最终真相
+
+在当前宿主语义下：
+
+1. `is_system=true`
+2. 既可能表示“真正的系统消息”
+3. 也可能表示“被 `/hide` 隐藏的普通历史楼层”
+
+因此：
+
+1. 对主 AI prompt 组装来说，`is_system` 也许仍然有意义
+2. 但对 BME extraction 来说，`is_system` 已经不是可靠的“是否可读”判据
+
+### 判断 2：要把“主 AI 可见消息集合”和“BME 提取消息集合”彻底拆开
+
+建议明确分成两套语义：
+
+1. **主 AI 可见集合**
+   - 可以继续受 `/hide` 影响
+   - 这是节约 token 的目的
+
+2. **BME 提取集合**
+   - 应由“真实楼层窗口 + `extractContextTurns`”决定
+   - 不应因为楼层被 `/hide` 而自动丢失
+
+### 判断 3：在 extraction 真正去耦之前，不要删除 hide-engine 的本地双写
+
+原因不是双写本身正确，而是现在直接删会导致两个风险：
+
+1. 提取链路仍可能把宿主 `/hide` 后的消息当成不可提取
+2. 现有测试和状态恢复逻辑仍依赖 `__st_bme_hide_managed` 追踪“哪些是 BME 自己接管过的消息”
+
+所以：
+
+> hide-engine 的本地双写最终应删除，但删除动作必须放到 extraction 语义彻底收敛之后。
+
+### 判断 4：`managedSystemIndices` 在阶段 4 不能直接消失，而要重定义语义
+
+当前 `hideState.managedSystemIndices` 同时承担两层职责：
+
+1. 追踪“哪些消息曾被 BME 本地写成 `is_system=true`”
+2. 作为 `__st_bme_hide_managed` 的间接来源，帮助 extraction 判断“哪些是 BME 自己接管过的隐藏范围”
+
+当阶段 4 删除本地双写后：
+
+1. 第一层职责不再需要
+2. 第二层职责仍然需要，只是语义应变成：
+   - “BME 当前管理的隐藏范围/索引集合”
+   - 而不是“BME 本地改过 `is_system` 的消息集合”
+
+所以阶段 3 -> 4 的过渡不能只是删函数，还必须同步：
+
+1. 重命名或重定义 `managedSystemIndices`
+2. 让 extraction helper 改为查询“managed hide range”而不是 `__st_bme_hide_managed`
+
+---
+
+## 推荐执行顺序
+
+### 阶段 1：先把 extraction 的“可读消息判定”抽象成独立策略
+
+目标：
+
+1. 不要让 `chat-history.js` 继续直接用“`is_system` + BME marker”做最终判定
+2. 改成一层明确的语义函数，例如：
+   - `isManagedHiddenMessageAtIndex`
+   - `isTrueSystemMessageForExtraction`
+   - `isExtractionVisibleMessage`
+
+建议动作：
+
+1. 在 [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js) 收口所有提取可见性判断
+2. 让：
+   - `getAssistantTurns`
+   - `buildExtractionMessages`
+   - `getChatIndexForPlayableSeq`
+   - `getChatIndexForAssistantSeq`
+   全部只依赖这组新 helper
+
+目的：
+
+1. 以后改宿主 `/hide` 兼容策略时，只改一层 helper
+2. 不再把 `is_system` 判断分散在多个函数里
+
+### 阶段 2：改成“由 hide-engine 暴露管理范围”，不要继续押注宿主附加标记
+
+当前已知：
+
+1. 宿主 `/hide` 会把普通消息改成 `is_system=true`
+2. 当前没有可靠证据表明宿主会补充稳定的 message-level 隐藏标记
+
+因此阶段 2 建议改成：
+
+1. 在 [hide-engine.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\hide-engine.js) 暴露查询接口，例如：
+   - `isInManagedHideRange(index)`
+   - 或 `isManagedHiddenIndex(index)`
+2. extraction 侧不再猜测“这条 `is_system` 是否是 host hide 后的普通消息”
+3. 而是直接问 hide-engine：
+   - “这个 index 是否处在 BME 当前管理的隐藏范围内？”
+
+这样做的好处：
+
+1. 不依赖宿主是否打标记
+2. 不依赖消息内容特征猜测
+3. 与用户真实需求更一致，因为用户要解决的是 **BME 自动隐藏旧楼层** 场景
+
+这也意味着阶段 2 的设计边界应明确写入：
+
+1. 第一轮保证“BME 自动隐藏”与 extraction 解耦
+2. 宿主手动 `/hide` 是否也纳入 extraction，可放在后续兼容层处理
+
+### 阶段 3：让 extraction 真正按窗口读取，而不是按 hidden/system 可见性读取
+
+目标：
+
+1. 真正实现“BME 读取用户配置的 N 楼层”
+2. `extractContextTurns` 成为决定提取上下文的主参数
+
+建议动作：
+
+1. 在 [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js) 明确：
+   - assistant turn 序列如何计算
+   - `startIdx/endIdx` 对应的上下文窗口如何取
+   - 哪些消息只是“不进入主 AI prompt”，但仍进入 extraction
+
+2. 确保 [extraction-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\extraction-controller.js) 的：
+   - 自动提取
+   - 手动提取
+   - reroll / replay
+   全部共享同一套 assistant turn 与 context window 判定
+
+3. 验证 `extractContextTurns` 的语义在 UI 和代码里保持一致
+   - 用户设置多少，就读取多少个上下文轮次
+
+阶段 3 还要额外补一条验证说明：
+
+1. 当前 [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js) 的
+   `contextStart = Math.max(0, startIdx - contextTurns * 2)`
+   本质上是按 chat index 偏移，不是按“真实可提取 turn 数”回溯
+2. 当中间夹杂真正 system 消息时，用户设置的 `extractContextTurns` 可能仍会少读
+
+这条不一定是 blocker，但阶段 3 验收必须补测试：
+
+1. 中间夹有真正 system 消息时，窗口是否仍符合用户对“最近 N 个 turn”的预期
+2. 若不符合，再决定是否把窗口算法从“index 偏移”升级成“按 assistant/user turn 回溯”
+
+### 阶段 4：只有在阶段 3 通过后，才移除 hide-engine 的本地 `is_system` 双写
+
+目标：
+
+1. 把隐藏引擎收敛成纯 `/hide` / `/unhide`
+
+建议动作：
+
+1. 在 [hide-engine.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\hide-engine.js) 删除或废弃：
+   - `markManagedSystemRange`
+   - `restoreManagedSystemFlags`
+   - `syncSystemAttribute`
+   - `__st_bme_hide_managed` 相关逻辑
+
+2. 保留：
+   - 范围计算
+   - slash command 调度
+   - 增量隐藏检查
+   - unhide 管理
+   - managed hide range 查询接口
+
+3. 重写相关测试，使其不再断言：
+   - “applyHideSettings 后 chat[i].is_system 被 BME 写成 true”
+
+而改为断言：
+
+1. 发出了正确的 `/hide` / `/unhide` 命令
+2. extraction 在隐藏开启时仍能读到配置窗口内的上下文
+3. `managedSystemIndices`（或其重命名版本）已从“本地双写追踪器”转成“managed hide range 状态”
+
+---
+
+## 需要修改/复核的文件清单
+
+### 必改
+
+1. [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js)
+   - 提取可见性判定的唯一真源
+
+2. [extraction-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\extraction-controller.js)
+   - 自动提取 / 手动提取 / reroll / replay 是否完整复用新判定
+
+3. [hide-engine.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\hide-engine.js)
+   - 最终收敛为纯 `/hide` / `/unhide`
+
+4. [tests\chat-history.mjs](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\tests\chat-history.mjs)
+   - 扩展为“宿主 `/hide` 产生的普通 system 化消息仍可被 extraction 读取”的测试
+
+5. [tests\hide-engine.mjs](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\tests\hide-engine.mjs)
+   - 重写对 `is_system` 的旧预期
+
+### 视范围决定是否同步调整
+
+1. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js)
+   - 任何仍影响 extraction 预判的 `is_system` 过滤
+
+2. [panel.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\panel.js)
+   - 仅确认配置语义，无需大改
+
+3. [recall-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\recall-controller.js)
+4. [recall-persistence.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\recall-persistence.js)
+   - 建议暂不并入第一轮，除非后续验证发现 recall 也必须读取被隐藏楼层
+
+另外明确说明两处当前不建议改动：
+
+1. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js) 的 `getLatestUserChatMessage`
+2. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js) 的 `getLastNonSystemChatMessage`
+
+原因：
+
+1. 这两处属于 recall / send-intent 输入整形
+2. 面向主 AI 可见尾部，而不是 extraction 读取窗口
+3. 当前保持按裸 `is_system` 跳过隐藏楼层是合理的，不应并入本次 extraction 解耦
+
+---
+
+## 建议测试矩阵
+
+### A. 纯 extraction 语义
+
+1. 宿主 `/hide` 前后，同一条普通 assistant 消息都应仍可被提取窗口覆盖
+2. `extractContextTurns=2` 时，只读取目标 assistant 前固定窗口，不无限扩张
+3. 自动提取、手动提取、replay、reroll 的窗口语义一致
+4. 中间夹有真正 system 消息时，窗口语义是否仍满足“最近 N 个 turn”的产品预期
+
+### B. 隐藏与主 AI 可见性
+
+1. 开启旧楼层隐藏后，主 AI 仍只看到保留窗口
+2. BME 仍能从被隐藏楼层中拿到所需上下文
+3. BME 自动隐藏场景依赖的是 managed hide range，而不是宿主附加消息标记
+
+### C. 回归风险
+
+1. 不再因隐藏状态变化触发历史误恢复
+2. 自动提取在新聊天中继续正常推进
+3. 历史恢复后 extraction status 不再残留“AI 生成中”
+
+---
+
+## 对另一个 AI 的最短结论
+
+> 用户的目标是“隐藏只负责 `/hide`，提取只负责按 `extractContextTurns` 读真实楼层窗口”。本次梳理已确认宿主 ST 的 `/hide` 本身就会把普通消息写成 `is_system=true`，因此不能靠删除 BME 本地 `is_system` 双写来完成解耦。当前最稳的阶段 2 主策略，不是继续寻找宿主附加标记，而是让 `hide-engine.js` 暴露 managed hide range 查询接口，由 extraction 按 index 反查“这个楼层是否是 BME 自动隐藏范围的一部分”，从而把 BME 自动隐藏的普通楼层与真正 system 消息区分开。只有在 extraction 彻底摆脱 `is_system` 依赖后，才能安全把 `hide-engine.js` 收敛成纯 `/hide` / `/unhide`。 
diff --git a/.claude/plans/recall-card-user-input-display-toggle-plan.md b/.claude/plans/recall-card-user-input-display-toggle-plan.md
new file mode 100644
index 0000000..989362f
--- /dev/null
+++ b/.claude/plans/recall-card-user-input-display-toggle-plan.md
@@ -0,0 +1,406 @@
+# ST-BME Recall Card 用户输入显示开关方案
+
+## 背景与用户痛点
+当前 ST-BME 在聊天楼层里会额外渲染一张 Recall Card，用来展示：
+
+- 本轮用户输入
+- 相关记忆召回
+- 召回节点数量
+- token 估算
+- 展开的召回图与注入内容
+
+这张卡目前是“额外附着在用户消息下面”的显示层，而不是替换原始用户消息本身。因此会出现一个明显问题：
+
+- 聊天界面里先看到原始用户输入
+- Recall Card 里又重复显示一遍“本轮用户输入”
+
+结果就是视觉重复。尤其对那些本来就自己做了用户输入栏美化的使用者来说，这张卡顶部的“本轮用户输入”区域会和现有前端样式冲突，形成一个突兀的“黄框重复展示”。
+
+用户的核心诉求有两个：
+
+1. “美化用户输入”必须变成可选项，不能强制显示。
+2. 如果用户选择“要显示美化后的用户输入”，那就必须同步隐藏原始用户输入，不能出现两份一模一样的文本并排或上下重复。
+
+重要边界：
+
+- 当前插件功能实际上是可用的，问题主要在显示策略。
+- 不要改召回逻辑、注入逻辑、持久化逻辑、图谱逻辑、检索逻辑。
+- 这是一个 UI 显示层改造，不是功能链路重写。
+
+## 已定位结论
+这个问题已经确认是前端展示层造成的，不是后端或 prompt 注入重复。
+
+### 1. 黄框来源
+Recall Card 本体由 [recall-message-ui.js](../../recall-message-ui.js) 创建：
+
+- `createRecallCardElement(...)` 负责生成整张卡
+- 其中“本轮用户输入”部分是直接写死渲染的
+
+关键位置：
+
+- [recall-message-ui.js:183](../../recall-message-ui.js#L183)
+- [recall-message-ui.js:203](../../recall-message-ui.js#L203)
+- [recall-message-ui.js:207](../../recall-message-ui.js#L207)
+
+### 2. 黄框样式来源
+Recall Card 的外观样式在 [style.css](../../style.css)：
+
+- 卡片容器： [style.css:2777](../../style.css#L2777)
+- 用户输入 label： [style.css:2787](../../style.css#L2787)
+- 用户输入文本： [style.css:2797](../../style.css#L2797)
+
+### 3. 卡片挂载方式
+Recall Card 不是一条新消息，也不是替换原消息。
+它是附加在原始 user 楼层 DOM 下面：
+
+- 锚点解析： [index.js:1822](../../index.js#L1822)
+- 卡片挂载： [index.js:1999](../../index.js#L1999)
+
+而且传入卡片的 `userMessageText` 就是原始 `message.mes`：
+
+- [index.js:2002](../../index.js#L2002)
+
+### 4. 后端/数据链路没有重复注入
+Recall Card 展示的数据来自用户消息上的持久化 recall 记录，不是额外造了一条消息：
+
+- 读取持久化记录： [recall-persistence.js:24](../../recall-persistence.js#L24)
+- 只要有 `injectionText` 才渲染卡片： [index.js:1952](../../index.js#L1952)
+
+因此，用户在酒馆后端看到的“只有用户输入 + 调回的记忆”这一观察是对的。现在的重复只发生在前端视觉层。
+
+## 目标
+在不改变 ST-BME 现有功能链路的前提下，为 Recall Card 增加一个“美化用户输入”的显示策略开关。
+
+最终需要满足：
+
+- 用户可以关闭 Recall Card 顶部那块“本轮用户输入”展示
+- 用户也可以保留这块美化展示
+- 当保留美化展示时，要自动隐藏原始 user 消息文本，避免视觉重复
+- 当关闭美化展示时，要确保原始 user 消息文本正常显示
+- 不影响记忆召回、持久化、注入、展开图谱、编辑、删除、重跑召回等现有能力
+
+## UI 放置要求
+用户指定要把“美化用户输入”的选项放在“功能开关”页，位置参考截图中的空位。
+
+建议放置方式：
+
+- 放在“隐藏旧楼层”这张卡附近
+- 作为同级的新配置卡，或作为该区域右侧空位中的独立卡片
+- 文案应一眼说明“这只是显示策略，不影响召回本身”
+
+建议标题：
+
+- `美化用户输入`
+
+建议副说明：
+
+- `控制 Recall Card 是否接管本轮用户输入的展示方式，不影响实际召回与注入。`
+
+## 推荐方案
+不要只做一个简单布尔值。更稳妥的是做成一个三态“显示模式”，这样另一位实现 AI 会更容易避免歧义。
+
+建议新增设置字段：
+
+- `recallCardUserInputDisplayMode`
+
+建议取值：
+
+1. `off`
+   不在 Recall Card 内显示“本轮用户输入”区域。
+   原始 user 消息保持原样显示。
+
+2. `beautify_only`
+   在 Recall Card 内显示“本轮用户输入”区域。
+   同时隐藏原始 user 消息文本。
+   这是最符合当前用户诉求的模式。
+
+3. `mirror`
+   在 Recall Card 内显示“本轮用户输入”区域。
+   原始 user 消息也继续显示。
+   这个模式保留当前行为，作为兼容选项。
+
+默认值建议：
+
+- 为兼容旧版本与已有用户习惯，默认值建议设为 `mirror`
+
+原因：
+
+- 不会改变现有安装用户的默认视觉结果
+- 只是新增可选项，不会破坏已有使用体验
+- 用户可以手动切换成自己想要的模式
+
+如果维护者更希望新装即减少视觉重复，也可以考虑默认 `off`。但那属于产品决策，不是技术必须。
+
+## 最小改动原则
+这次改动必须严格限制在“显示层”和“设置层”。
+
+允许改动：
+
+- `index.js`
+- `panel.html`
+- `panel.js`
+- `recall-message-ui.js`
+- `style.css`
+
+不要改动：
+
+- `recall-controller.js`
+- `retriever.js`
+- `injector.js`
+- `recall-persistence.js`
+- 任何召回算法、注入算法、存储结构、图谱结构
+
+## 实施方案
+
+### 一、设置层
+在 [index.js](../../index.js) 的默认设置中新增字段：
+
+- 位置： [index.js:343](../../index.js#L343)
+- 新增：`recallCardUserInputDisplayMode: "mirror"`
+
+要求：
+
+- 通过现有 `getSettings()` 和 `updateModuleSettings()` 走统一设置链路
+- 不新增独立存储机制
+- 不改服务端设置保存结构的总体行为，只是增加一个普通字段
+
+### 二、配置面板层
+在“功能开关”页面增加“美化用户输入”设置入口。
+
+建议实现方式：
+
+- 在 [panel.html](../../panel.html) 的 `toggles` 区块中新增一张配置卡
+- 位置靠近“隐藏旧楼层”卡片，使用截图中右侧空位
+- 在 [panel.js](../../panel.js) 中补充读写绑定
+
+建议交互形式：
+
+- 使用 `select`
+- 三个选项分别对应：
+  - `关闭美化，仅显示原始输入`
+  - `由 Recall Card 接管显示，并隐藏原始输入`
+  - `Recall Card 与原始输入同时显示（兼容模式）`
+
+为什么不建议只放 checkbox：
+
+- 因为 checkbox 很难同时表达“关闭”“替代”“保留重复”三种模式
+- 三态更清楚，也更利于向后兼容
+
+如果 UI 组件层面确实只适合 checkbox，也可以退化为：
+
+- `启用用户输入美化`
+- `启用后隐藏原始用户输入`
+
+但三态仍然是首选。
+
+### 三、Recall Card 渲染层
+在 [recall-message-ui.js](../../recall-message-ui.js) 里，只改“本轮用户输入”这块的渲染条件，不动其他内容。
+
+具体要求：
+
+- `createRecallCardElement(...)` 增加一个新的显示模式参数
+- `updateRecallCardData(...)` 也能同步接收该模式
+- 当模式为 `off` 时：
+  - 不创建 `userLabel`
+  - 不创建 `userText`
+  - 或者创建后直接隐藏，但更推荐不创建
+- 当模式为 `beautify_only` 或 `mirror` 时：
+  - 保持现有用户输入区渲染
+
+不要改动：
+
+- 召回条
+- 节点数 badge
+- token hint
+- 展开/折叠
+- 图谱渲染
+- 注入文本展示
+- 编辑/删除/重跑召回按钮逻辑
+
+### 四、原始用户输入隐藏层
+这部分是本次方案的关键，也是最容易误伤其他逻辑的地方。
+
+目标：
+
+- 只隐藏原始 user 消息正文文本
+- 不能把整条 `.mes` 或 `.mes_block` 隐藏掉
+- 否则 Recall Card 自己也会跟着消失
+
+建议做法：
+
+1. 在 `index.js` 的 Recall Card 刷新流程中，拿到目标 `messageElement` 后：
+   - 定位其原始文本容器，优先找 `.mes_text`
+2. 根据 `recallCardUserInputDisplayMode` 决定是否给该文本容器加一个 ST-BME 专用 class 或 data attribute
+3. 在 `style.css` 里为这个专用 class 提供隐藏样式
+
+建议新增 class：
+
+- `bme-hide-original-user-text`
+
+建议样式原则：
+
+- 仅隐藏文本区域本身
+- 不要影响按钮区、头像区、楼层容器尺寸计算
+
+这里推荐优先用“受控 class 切换”，不要直接写行内 `display:none`，原因是：
+
+- 刷新时更容易恢复
+- DOM 重绘后更容易重新应用
+- 更利于调试
+
+强制实现约束：
+
+- 只能在当前目标楼层的 `messageElement` 作用域内查找 `.mes_text`
+- 推荐写法是 `messageElement.querySelector('.mes_text')`
+- 不允许使用 `document.querySelectorAll('.mes_text')`、全局批量扫描后再按索引猜测匹配对象，或任何会波及其他楼层的全局操作
+
+原因：
+
+- 这个需求只应该影响“当前挂载 Recall Card 的那一条 user 楼层”
+- 如果实现成全局 `.mes_text` 操作，最容易出现误隐藏其他消息、切换模式后残留、以及聊天重绘时状态串楼层的问题
+
+### 五、刷新与恢复逻辑
+Recall Card UI 不是一次性静态渲染，而是会随消息刷新、设置变更、聊天切换重新挂载或更新。
+
+因此必须保证：
+
+- 切到 `beautify_only` 时，已存在的卡片能立即隐藏原始输入
+- 切到 `off` 或 `mirror` 时，已隐藏的原始输入能立即恢复
+- 删除 Recall Card 时，原始输入也要恢复
+- 聊天切换或楼层 DOM 重建后，显示状态能重新正确应用
+
+建议实现策略：
+
+- 在 `refreshPersistedRecallMessageUi()` 流程中统一应用
+- 在 `cleanupRecallArtifacts(...)` / `cleanupRecallCardElement(...)` 附近补一层“恢复原始文本显示”的兜底
+- 在设置更新时，若 patch 包含 `recallCardUserInputDisplayMode`，主动触发一次 Recall Card UI refresh
+
+## 兼容性要求
+
+### 必须保持不变
+- Recall 是否执行
+- Recall 结果如何写入持久化记录
+- 注入文本如何进入 prompt
+- token 估算
+- 展开的节点图
+- 编辑 recall 注入文本
+- 删除 recall 记录
+- 重跑 recall
+- 非 user 楼层不挂载 Recall Card 的规则
+
+### 必须新增保证
+- 无论用户怎样切换这个显示模式，都不能影响后端实际发送内容
+- 无论用户怎样切换这个显示模式，都不能让 recall 记录丢失
+- 无论用户怎样切换这个显示模式，都不能改变注入结果
+
+## 建议验收场景
+另一位实现 AI 可以按下面场景验收。
+
+### 场景 1：兼容模式
+设置为 `mirror`
+
+期望：
+
+- 行为与当前版本一致
+- 原始用户输入可见
+- Recall Card 顶部“本轮用户输入”也可见
+
+### 场景 2：关闭美化
+设置为 `off`
+
+期望：
+
+- 原始用户输入可见
+- Recall Card 仍保留“相关记忆召回”条、节点数、token、展开内容
+- 只是顶部“本轮用户输入”区域不再显示
+
+### 场景 3：美化接管
+设置为 `beautify_only`
+
+期望：
+
+- 原始用户输入文本被隐藏
+- Recall Card 顶部“本轮用户输入”仍显示
+- 聊天界面不再看到两份重复文本
+
+### 场景 4：设置动态切换
+在已有聊天记录上来回切换三种模式
+
+期望：
+
+- 不需要重开聊天
+- UI 立即生效
+- 不出现隐藏状态残留
+
+### 场景 5：删除 recall 记录
+在 `beautify_only` 模式下删除某条 Recall Card
+
+期望：
+
+- Recall Card 消失
+- 原始用户输入文本恢复显示
+
+### 场景 6：刷新 / 切聊天 / 重新挂载
+
+期望：
+
+- 模式设置持久生效
+- DOM 重建后显示仍然正确
+
+### 场景 7：多条消息并存时的作用域验证
+
+期望：
+
+- 在一个有多条 user 消息、且其中只有部分楼层存在 Recall Card 的聊天里
+- 切换 `beautify_only` 时，只隐藏挂载了 Recall Card 的目标楼层原始文本
+- 没有 Recall Card 的其他 user 楼层不得被隐藏
+- 切回 `off` 或 `mirror` 时，只恢复对应目标楼层，不出现跨楼层串改
+
+## 风险点与防误改提醒
+
+### 风险 1：误把整条消息隐藏
+如果实现时隐藏的是 `.mes`、`.mes_block` 或更外层容器，会把 Recall Card 自己也一起隐藏。
+
+正确做法：
+
+- 只处理原始用户文本区域
+- 而且这个文本区域必须通过当前 `messageElement` 局部查询获得，不能用全局 `.mes_text` 选择器批量处理
+
+### 风险 2：把显示问题误改成数据问题
+这个需求不是要删 `message.mes`，也不是要清理持久化 recall 记录。
+
+正确做法：
+
+- 只改 DOM 渲染与 class 切换
+
+### 风险 3：设置切换后残留隐藏状态
+如果只在创建卡片时加隐藏样式，而不在 refresh / cleanup 时恢复，会导致切换模式后文本状态错乱。
+
+正确做法：
+
+- 在刷新和清理路径都处理恢复逻辑
+
+### 风险 4：误动 Recall Card 其他区域
+用户只对“本轮用户输入这块美化显示”有意见，不是要取消整个 Recall Card。
+
+正确做法：
+
+- 只拆分顶部 user-input 区块的显示策略
+- 保留下面的 recall bar 与展开内容
+
+## 推荐实施顺序
+
+1. 在 `index.js` 增加默认设置字段
+2. 在 `panel.html` / `panel.js` 增加配置项，并放到“功能开关”页截图所示空位
+3. 在 `recall-message-ui.js` 给顶部 user-input 区块加显示模式控制
+4. 在 `index.js` 增加“隐藏/恢复原始 user 文本”的 DOM 协调逻辑
+5. 在 `style.css` 增加专用隐藏 class
+6. 跑一轮上述验收场景
+
+## 给实现 AI 的一句话总结
+这次改动的本质是：
+
+- 保留 Recall Card 功能
+- 只把 Recall Card 顶部“本轮用户输入”的显示变成可选
+- 并在“由 Recall Card 接管显示”时隐藏原始 user 文本
+- 不要动任何 recall / injection / persistence 的核心逻辑
diff --git a/chat-history.js b/chat-history.js
index 332f490..4c657f6 100644
--- a/chat-history.js
+++ b/chat-history.js
@@ -123,7 +123,7 @@ export function resolveDirtyFloorFromMutationMeta(trigger, primaryArg, meta, cha
   const isDeleteTrigger = String(trigger || "").includes("message-deleted");
   const minExtractableFloor = getMinExtractableAssistantFloor(chat);
 
-  // 删除后 chat 已是收缩后的状态，删除事件携带的 seq 更接近“被删区间起点”，
+  // 删除后 chat 已是收缩后的状态，删除事件携带的 seq 更接近"被删区间起点"，
   // 因此这里额外向前退一层，避免恢复仍停留在被删楼层对应的旧图谱边界。
   if (!isDeleteTrigger && Number.isFinite(meta.messageId)) {
     candidates.push({
diff --git a/index.js b/index.js
index f68d578..9acade6 100644
--- a/index.js
+++ b/index.js
@@ -352,6 +352,7 @@ const defaultSettings = {
 
   // 召回设置
   recallEnabled: true,
+  recallCardUserInputDisplayMode: "beautify_only",
   recallTopK: 20, // 向量预筛 Top-K
   recallMaxNodes: 8, // LLM 召回最大节点数
   recallEnableLLM: true, // 是否启用 LLM 精确召回
@@ -1757,6 +1758,10 @@ function isDomNodeAttached(node) {
 
 function cleanupRecallCardElement(cardElement) {
   if (!cardElement) return;
+  const messageElement = cardElement.closest?.(".mes") || null;
+  if (messageElement) {
+    restoreRecallCardUserInputDisplay(messageElement);
+  }
   try {
     cardElement._bmeDestroyRenderer?.();
   } catch (error) {
@@ -1777,6 +1782,7 @@ function cleanupRecallArtifacts(messageElement, keepMessageIndex = null) {
   if (!messageElement?.querySelectorAll) return;
 
   cleanupLegacyRecallBadges(messageElement);
+  restoreRecallCardUserInputDisplay(messageElement);
 
   const existingCards = Array.from(
     messageElement.querySelectorAll(".bme-recall-card") || [],
@@ -1831,6 +1837,34 @@ function resolveRecallCardAnchor(messageElement) {
   return isDomNodeAttached(messageElement) ? messageElement : null;
 }
 
+function normalizeRecallCardUserInputDisplayMode(mode) {
+  const normalized = String(mode || "").trim();
+  if (
+    normalized === "off" ||
+    normalized === "beautify_only" ||
+    normalized === "mirror"
+  ) {
+    return normalized;
+  }
+  return "beautify_only";
+}
+
+function applyRecallCardUserInputDisplayMode(messageElement, mode) {
+  if (!messageElement?.querySelector) return;
+  const userTextElement = messageElement.querySelector(".mes_text");
+  if (!userTextElement) return;
+  userTextElement.classList.toggle(
+    "bme-hide-original-user-text",
+    normalizeRecallCardUserInputDisplayMode(mode) === "beautify_only",
+  );
+}
+
+function restoreRecallCardUserInputDisplay(messageElement) {
+  if (!messageElement?.querySelector) return;
+  const userTextElement = messageElement.querySelector(".mes_text");
+  userTextElement?.classList?.remove("bme-hide-original-user-text");
+}
+
 function buildPersistedRecallUiRetryDelays(initialDelayMs = 0) {
   const normalizedInitial = Math.max(
     0,
@@ -1882,7 +1916,12 @@ function refreshPersistedRecallMessageUi() {
     };
   }
 
-  const themeName = getSettings()?.panelTheme || "crimson";
+  const settings = getSettings();
+  const themeName = settings?.panelTheme || "crimson";
+  const recallCardUserInputDisplayMode =
+    normalizeRecallCardUserInputDisplayMode(
+      settings?.recallCardUserInputDisplayMode,
+    );
   const callbacks = getRecallCardCallbacks();
   const messageElementMap = new Map();
   const messageElements = Array.from(chatRoot.querySelectorAll(".mes"));
@@ -1931,6 +1970,9 @@ function refreshPersistedRecallMessageUi() {
       ) || null;
 
     if (!message?.is_user) {
+      if (messageElement) {
+        restoreRecallCardUserInputDisplay(messageElement);
+      }
       if (existingCard) cleanupRecallCardElement(existingCard);
       const unexpectedRecord = readPersistedRecallFromUserMessage(
         chat,
@@ -1951,6 +1993,9 @@ function refreshPersistedRecallMessageUi() {
 
     const record = readPersistedRecallFromUserMessage(chat, messageIndex);
     if (!record?.injectionText) {
+      if (messageElement) {
+        restoreRecallCardUserInputDisplay(messageElement);
+      }
       if (existingCard) cleanupRecallCardElement(existingCard);
       continue;
     }
@@ -1970,6 +2015,7 @@ function refreshPersistedRecallMessageUi() {
 
     const anchor = resolveRecallCardAnchor(messageElement);
     if (!anchor) {
+      restoreRecallCardUserInputDisplay(messageElement);
       cleanupRecallCardElement(existingCard);
       summary.anchorFailureIndices.push(messageIndex);
       debugPersistedRecallUi(
@@ -1991,6 +2037,7 @@ function refreshPersistedRecallMessageUi() {
     if (currentCard) {
       updateRecallCardData(currentCard, record, {
         userMessageText: message.mes || "",
+        userInputDisplayMode: recallCardUserInputDisplayMode,
         graph: currentGraph,
         themeName,
         callbacks,
@@ -2000,12 +2047,17 @@ function refreshPersistedRecallMessageUi() {
         messageIndex,
         record,
         userMessageText: message.mes || "",
+        userInputDisplayMode: recallCardUserInputDisplayMode,
         graph: currentGraph,
         themeName,
         callbacks,
       });
       anchor.appendChild(card);
     }
+    applyRecallCardUserInputDisplayMode(
+      messageElement,
+      recallCardUserInputDisplayMode,
+    );
     summary.renderedCount += 1;
   }
 
@@ -4899,6 +4951,7 @@ function updateModuleSettings(patch = {}) {
     "hideOldMessagesEnabled",
     "hideOldMessagesKeepLastN",
   ]);
+  const recallUiKeys = new Set(["recallCardUserInputDisplayMode"]);
   const settings = getSettings();
   Object.assign(settings, patch);
   extension_settings[MODULE_NAME] = settings;
@@ -4955,6 +5008,10 @@ function updateModuleSettings(patch = {}) {
     }
   }
 
+  if (Object.keys(patch).some((key) => recallUiKeys.has(key))) {
+    schedulePersistedRecallMessageUiRefresh(30);
+  }
+
   scheduleServerSettingsSave();
   return settings;
 }
diff --git a/panel.html b/panel.html
index 73631bc..0e5ff65 100644
--- a/panel.html
+++ b/panel.html
@@ -1021,6 +1021,35 @@
                     </button>
                   </div>
                 </div>
+
+                <div class="bme-config-card">
+                  <div class="bme-config-card-head">
+                    <div>
+                      <div class="bme-config-card-title">美化用户输入</div>
+                      <div class="bme-config-card-subtitle">
+                        控制 Recall Card 是否接管本轮用户输入的展示方式，不影响实际召回与注入。
+                      </div>
+                    </div>
+                  </div>
+                  <div class="bme-config-row">
+                    <label for="bme-setting-recall-card-user-input-display-mode">
+                      显示模式
+                    </label>
+                    <select
+                      id="bme-setting-recall-card-user-input-display-mode"
+                      class="bme-config-input"
+                    >
+                      <option value="off">关闭美化，仅显示原始输入</option>
+                      <option value="beautify_only">
+                        由 Recall Card 接管显示，并隐藏原始输入
+                      </option>
+                      <option value="mirror">Recall Card 与原始输入同时显示</option>
+                    </select>
+                  </div>
+                  <div class="bme-config-help">
+                    只调整聊天楼层里的显示方式，不改变记忆召回、注入 prompt 或消息实际发送内容。
+                  </div>
+                </div>
               </div>
             </section>
 
diff --git a/panel.js b/panel.js
index c1bb1d1..a72c61b 100644
--- a/panel.js
+++ b/panel.js
@@ -1537,6 +1537,10 @@ function _refreshConfigTab() {
     "bme-setting-reflection-enabled",
     settings.enableReflection ?? false,
   );
+  _setInputValue(
+    "bme-setting-recall-card-user-input-display-mode",
+    settings.recallCardUserInputDisplayMode ?? "beautify_only",
+  );
 
   _setInputValue("bme-setting-extract-every", settings.extractEvery ?? 1);
   _setInputValue(
@@ -1815,6 +1819,21 @@ function _bindConfigControls() {
     _patchSettings({ enableReflection: checked });
     _refreshGuardedConfigStates();
   });
+  const recallCardUserInputDisplayModeEl = document.getElementById(
+    "bme-setting-recall-card-user-input-display-mode",
+  );
+  if (
+    recallCardUserInputDisplayModeEl &&
+    recallCardUserInputDisplayModeEl.dataset.bmeBound !== "true"
+  ) {
+    recallCardUserInputDisplayModeEl.addEventListener("change", () => {
+      _patchSettings({
+        recallCardUserInputDisplayMode:
+          recallCardUserInputDisplayModeEl.value || "beautify_only",
+      });
+    });
+    recallCardUserInputDisplayModeEl.dataset.bmeBound = "true";
+  }
 
   bindNumber("bme-setting-extract-every", 1, 1, 50, (value) =>
     _patchSettings({ extractEvery: value }),
diff --git a/recall-message-ui.js b/recall-message-ui.js
index dc22847..7a37b97 100644
--- a/recall-message-ui.js
+++ b/recall-message-ui.js
@@ -79,6 +79,18 @@ function formatMetaLine(record) {
   return parts.join(" · ");
 }
 
+function normalizeUserInputDisplayMode(mode) {
+  const normalized = String(mode || "").trim();
+  if (
+    normalized === "off" ||
+    normalized === "beautify_only" ||
+    normalized === "mirror"
+  ) {
+    return normalized;
+  }
+  return "beautify_only";
+}
+
 function stableSerialize(value) {
   if (value === null || value === undefined) return "null";
   const type = typeof value;
@@ -186,6 +198,7 @@ export function createRecallCardElement({
   userMessageText = "",
   graph = null,
   themeName = "crimson",
+  userInputDisplayMode = "beautify_only",
   callbacks = {},
 }) {
   const card = el("div", "bme-recall-card");
@@ -197,6 +210,9 @@ export function createRecallCardElement({
   let activeUserMessageText = String(userMessageText || "");
   let activeGraph = graph || null;
   let activeCallbacks = callbacks || {};
+  let activeUserInputDisplayMode = normalizeUserInputDisplayMode(
+    userInputDisplayMode,
+  );
   let expandedRenderSignature = "";
 
   // -- 用户消息区 --
@@ -357,6 +373,11 @@ export function createRecallCardElement({
     if (Object.prototype.hasOwnProperty.call(next, "userMessageText")) {
       activeUserMessageText = String(next.userMessageText || "");
     }
+    if (Object.prototype.hasOwnProperty.call(next, "userInputDisplayMode")) {
+      activeUserInputDisplayMode = normalizeUserInputDisplayMode(
+        next.userInputDisplayMode,
+      );
+    }
     if (Object.prototype.hasOwnProperty.call(next, "graph")) {
       activeGraph = next.graph || null;
     }
@@ -366,6 +387,11 @@ export function createRecallCardElement({
 
     card.dataset.updatedAt = String(activeRecord?.updatedAt || "");
     card.dataset.expandedRenderSignature = expandedRenderSignature;
+    card.dataset.userInputDisplayMode = activeUserInputDisplayMode;
+    card.classList.toggle(
+      "bme-recall-hide-user-input",
+      activeUserInputDisplayMode === "off",
+    );
     userText.textContent = activeUserMessageText || "(empty)";
 
     const nodeCount = Array.isArray(activeRecord?.selectedNodeIds)
@@ -431,6 +457,7 @@ export function updateRecallCardData(cardElement, record, options = {}) {
     cardElement._bmeUpdateRecallCard({
       record,
       userMessageText: options?.userMessageText,
+      userInputDisplayMode: options?.userInputDisplayMode,
       graph: options?.graph,
       callbacks: options?.callbacks,
     });
diff --git a/style.css b/style.css
index 9ea007a..495af01 100644
--- a/style.css
+++ b/style.css
@@ -2802,6 +2802,19 @@
   word-break: break-word;
 }
 
+.bme-recall-card.bme-recall-hide-user-input .bme-recall-user-label,
+.bme-recall-card.bme-recall-hide-user-input .bme-recall-user-text {
+  display: none;
+}
+
+.bme-recall-card.bme-recall-hide-user-input .bme-recall-bar {
+  border-top: none;
+}
+
+.bme-hide-original-user-text {
+  display: none !important;
+}
+
 /* --- Recall Bar (collapse/expand trigger) --- */
 
 .bme-recall-bar {