diff --git a/.claude/plans/hide-host-system-decouple-plan.md b/.claude/plans/hide-host-system-decouple-plan.md
deleted file mode 100644
index 635a518..0000000
--- a/.claude/plans/hide-host-system-decouple-plan.md
+++ /dev/null
@@ -1,441 +0,0 @@
-# Hide / is_system 解耦与提取窗口收敛方案
-
-## 背景与用户真实诉求
-
-用户要解决的不是单点 bug，而是两个长期耦合问题：
-
-1. **自动隐藏旧楼层应只负责 `/hide` / `/unhide`**
-   - 不希望 BME 再本地改 `message.is_system`
-   - “重新应用当前隐藏”和“取消隐藏”也应收敛成 `/hide` / `/unhide`
-
-2. **BME 提取应按用户在“配置 -> 详细参数”里设置的上下文窗口读取**
-   - 目标参数是 `extractContextTurns`
-   - 主 AI 通过隐藏减少 token
-   - BME 仍能读到足够上下文，但不会无限读太多
-
-用户不希望继续出现以下情况：
-
-1. 隐藏状态影响 BME 是否能读到上下文
-2. 隐藏逻辑与历史恢复/提取逻辑继续共享 `is_system`
-3. 改掉一处后，另一处又因为 `is_system` 语义不清而出新 bug
-
----
-
-## 这次梳理后的核心结论
-
-### 结论 1：宿主 ST 的 `/hide` 本身就会改底层消息对象的 `is_system`
-
-这个结论已经通过运行时实测确认：
-
-1. 隐藏前：普通 assistant 消息对象没有 `is_system`
-2. 手动执行 `/hide 6-6`
-3. 隐藏后：同一条消息出现 `is_system: true`
-
-这意味着：
-
-1. **不能把“去掉 BME 自己的 `is_system` 双写”当成最终解**
-2. 即使删掉 `hide-engine.js` 里的 `markManagedSystemRange` / `restoreManagedSystemFlags`
-3. 宿主 `/hide` 仍然会把普通历史消息变成 `is_system=true`
-
-因此，若 BME 提取链路继续按 `is_system` 过滤消息，用户的目标仍然无法实现。
-
----
-
-### 结论 2：当前提取链路虽然已经部分松绑，但还没有真正完成“纯 `/hide`”
-
-当前代码状态：
-
-1. [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js)
-   - 已新增 `isBmeManagedHiddenMessage`
-   - 已新增 `isSystemMessageForExtraction`
-   - `getAssistantTurns`
-   - `buildExtractionMessages`
-   - `getChatIndexForPlayableSeq`
-   这些核心函数已经不再把 `extra.__st_bme_hide_managed === true` 的消息视为不可提取
-
-2. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js)
-   - `getSmartTriggerDecision` 相关路径已开始复用上述提取判定
-
-但问题在于：
-
-1. 这些改动目前只照顾到了 **BME 自己打了 `__st_bme_hide_managed` 标记** 的消息
-2. **宿主手动 `/hide`** 会直接把消息写成 `is_system=true`，但不会带 BME 标记
-3. 所以“真正的纯 `/hide` 设计”还没有完成
-
-换句话说：
-
-> 现在已经从“完全依赖 `is_system`”前进到了“BME 自己隐藏的消息可以继续提取”，但还没有前进到“凡是被 `/hide` 隐藏的普通楼层都能继续被 BME 按窗口读取”。
-
----
-
-### 结论 3：宿主 `/hide` 大概率没有稳定附加标记，阶段 2 不应继续押注“找宿主字段”
-
-基于当前实测：
-
-1. 宿主手动 `/hide` 后，消息会新增 `is_system: true`
-2. 当前没有证据表明 `extra` 或其他 message 字段会稳定补充“这是 host hidden ordinary message”的标记
-
-因此，阶段 2 的主策略不应是：
-
-1. 继续猜测 `extra.hidden`
-2. 继续猜测宿主会补别的 message-level 标记
-
-更稳的策略应改为：
-
-1. **让 hide-engine 暴露“BME 当前管理的隐藏范围”查询能力**
-2. extraction 侧按 index 查询“这个楼层是否在 BME 管理隐藏范围内”
-3. 把“BME 自动隐藏的普通楼层”和“真正 system 消息”区分开
-
-这条策略的边界也要说清楚：
-
-1. 它优先解决的是**用户最初诉求里的“BME 自动隐藏旧楼层”**
-2. 它不自动等价于“宿主任意手动 `/hide` 的所有楼层都被 BME 当可提取消息”
-
-也就是说，第一轮落地目标应是：
-
-> 保证 BME 自己自动 `/hide` 的旧楼层不会再干扰 extraction，而不是一次性接管所有外部手动 `/hide` 场景。
-
----
-
-### 结论 4：仍有若干非提取链路在按 `is_system` 过滤，但不应与本次目标混为一谈
-
-本次梳理中仍能看到这些位置：
-
-1. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js)
-   - `getLatestUserChatMessage`
-   - `getLastNonSystemChatMessage`
-
-2. [recall-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\recall-controller.js)
-   - `buildRecallRecentMessagesController` 仍跳过 `is_system`
-
-3. [recall-persistence.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\recall-persistence.js)
-   - `resolveGenerationTargetUserMessageIndex` 在 normal generation 下会跳过 `is_system`
-
-这些逻辑未必是 bug。它们更偏：
-
-1. recall / send-intent / prompt 注入输入整形
-2. 面向主 AI 可见聊天尾部，而不是 extraction 读取窗口
-
-所以不建议在“纯 `/hide` + extraction 去耦”阶段把 recall 逻辑一起大改。否则改动面会过大，容易把“主 AI 的可见上下文策略”和“BME 的提取上下文策略”混在一起。
-
----
-
-## 现状问题图
-
-```mermaid
-flowchart TD
-  A["旧楼层被隐藏"] --> B["宿主 /hide 将普通消息写成 is_system=true"]
-  B --> C["如果 BME 仍按 is_system 过滤"]
-  C --> D["提取窗口读不到被隐藏楼层"]
-  D --> E["用户设置的 extractContextTurns 失去意义"]
-
-  A --> F["BME hide-engine 还会本地双写 is_system"]
-  F --> G["进一步加重隐藏系统与提取系统耦合"]
-```
-
----
-
-## 已确认的代码位置
-
-### A. 当前仍在本地双写 `is_system` 的隐藏引擎
-
-[hide-engine.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\hide-engine.js)
-
-关键位置：
-
-1. `markManagedSystemRange`
-   - 直接写 `message.is_system = true`
-   - 写入 `extra.__st_bme_hide_managed = true`
-   - 同步 DOM `is_system` attribute
-
-2. `restoreManagedSystemFlags`
-   - 直接写回 `message.is_system = false`
-   - 删除 `extra.__st_bme_hide_managed`
-   - 同步 DOM `is_system` attribute
-
-### B. 当前提取窗口的核心入口
-
-[chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js)
-
-关键函数：
-
-1. `isAssistantChatMessage`
-2. `getAssistantTurns`
-3. `buildExtractionMessages`
-4. `getChatIndexForPlayableSeq`
-5. `getChatIndexForAssistantSeq`
-
-### C. 当前仍会影响提取/恢复批次推进的上层入口
-
-[extraction-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\extraction-controller.js)
-
-关键函数：
-
-1. `runExtractionController`
-2. `onManualExtractController`
-3. `onRerollController`
-4. `executeExtractionBatchController`
-
-### D. 当前“读取窗口配置”的用户入口
-
-[panel.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\panel.js)
-
-关键字段：
-
-1. `bme-setting-extract-context-turns`
-2. `settings.extractContextTurns`
-
-这说明用户最初说的“BME 读取用户自己设置的 N 楼层”并不是新概念，代码里已经有配置入口；问题在于提取链路还没有完全摆脱 `is_system` 对窗口的干扰。
-
----
-
-## 设计判断
-
-### 判断 1：不要再把 `is_system` 当成 extraction 的最终真相
-
-在当前宿主语义下：
-
-1. `is_system=true`
-2. 既可能表示“真正的系统消息”
-3. 也可能表示“被 `/hide` 隐藏的普通历史楼层”
-
-因此：
-
-1. 对主 AI prompt 组装来说，`is_system` 也许仍然有意义
-2. 但对 BME extraction 来说，`is_system` 已经不是可靠的“是否可读”判据
-
-### 判断 2：要把“主 AI 可见消息集合”和“BME 提取消息集合”彻底拆开
-
-建议明确分成两套语义：
-
-1. **主 AI 可见集合**
-   - 可以继续受 `/hide` 影响
-   - 这是节约 token 的目的
-
-2. **BME 提取集合**
-   - 应由“真实楼层窗口 + `extractContextTurns`”决定
-   - 不应因为楼层被 `/hide` 而自动丢失
-
-### 判断 3：在 extraction 真正去耦之前，不要删除 hide-engine 的本地双写
-
-原因不是双写本身正确，而是现在直接删会导致两个风险：
-
-1. 提取链路仍可能把宿主 `/hide` 后的消息当成不可提取
-2. 现有测试和状态恢复逻辑仍依赖 `__st_bme_hide_managed` 追踪“哪些是 BME 自己接管过的消息”
-
-所以：
-
-> hide-engine 的本地双写最终应删除，但删除动作必须放到 extraction 语义彻底收敛之后。
-
-### 判断 4：`managedSystemIndices` 在阶段 4 不能直接消失，而要重定义语义
-
-当前 `hideState.managedSystemIndices` 同时承担两层职责：
-
-1. 追踪“哪些消息曾被 BME 本地写成 `is_system=true`”
-2. 作为 `__st_bme_hide_managed` 的间接来源，帮助 extraction 判断“哪些是 BME 自己接管过的隐藏范围”
-
-当阶段 4 删除本地双写后：
-
-1. 第一层职责不再需要
-2. 第二层职责仍然需要，只是语义应变成：
-   - “BME 当前管理的隐藏范围/索引集合”
-   - 而不是“BME 本地改过 `is_system` 的消息集合”
-
-所以阶段 3 -> 4 的过渡不能只是删函数，还必须同步：
-
-1. 重命名或重定义 `managedSystemIndices`
-2. 让 extraction helper 改为查询“managed hide range”而不是 `__st_bme_hide_managed`
-
----
-
-## 推荐执行顺序
-
-### 阶段 1：先把 extraction 的“可读消息判定”抽象成独立策略
-
-目标：
-
-1. 不要让 `chat-history.js` 继续直接用“`is_system` + BME marker”做最终判定
-2. 改成一层明确的语义函数，例如：
-   - `isManagedHiddenMessageAtIndex`
-   - `isTrueSystemMessageForExtraction`
-   - `isExtractionVisibleMessage`
-
-建议动作：
-
-1. 在 [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js) 收口所有提取可见性判断
-2. 让：
-   - `getAssistantTurns`
-   - `buildExtractionMessages`
-   - `getChatIndexForPlayableSeq`
-   - `getChatIndexForAssistantSeq`
-   全部只依赖这组新 helper
-
-目的：
-
-1. 以后改宿主 `/hide` 兼容策略时，只改一层 helper
-2. 不再把 `is_system` 判断分散在多个函数里
-
-### 阶段 2：改成“由 hide-engine 暴露管理范围”，不要继续押注宿主附加标记
-
-当前已知：
-
-1. 宿主 `/hide` 会把普通消息改成 `is_system=true`
-2. 当前没有可靠证据表明宿主会补充稳定的 message-level 隐藏标记
-
-因此阶段 2 建议改成：
-
-1. 在 [hide-engine.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\hide-engine.js) 暴露查询接口，例如：
-   - `isInManagedHideRange(index)`
-   - 或 `isManagedHiddenIndex(index)`
-2. extraction 侧不再猜测“这条 `is_system` 是否是 host hide 后的普通消息”
-3. 而是直接问 hide-engine：
-   - “这个 index 是否处在 BME 当前管理的隐藏范围内？”
-
-这样做的好处：
-
-1. 不依赖宿主是否打标记
-2. 不依赖消息内容特征猜测
-3. 与用户真实需求更一致，因为用户要解决的是 **BME 自动隐藏旧楼层** 场景
-
-这也意味着阶段 2 的设计边界应明确写入：
-
-1. 第一轮保证“BME 自动隐藏”与 extraction 解耦
-2. 宿主手动 `/hide` 是否也纳入 extraction，可放在后续兼容层处理
-
-### 阶段 3：让 extraction 真正按窗口读取，而不是按 hidden/system 可见性读取
-
-目标：
-
-1. 真正实现“BME 读取用户配置的 N 楼层”
-2. `extractContextTurns` 成为决定提取上下文的主参数
-
-建议动作：
-
-1. 在 [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js) 明确：
-   - assistant turn 序列如何计算
-   - `startIdx/endIdx` 对应的上下文窗口如何取
-   - 哪些消息只是“不进入主 AI prompt”，但仍进入 extraction
-
-2. 确保 [extraction-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\extraction-controller.js) 的：
-   - 自动提取
-   - 手动提取
-   - reroll / replay
-   全部共享同一套 assistant turn 与 context window 判定
-
-3. 验证 `extractContextTurns` 的语义在 UI 和代码里保持一致
-   - 用户设置多少，就读取多少个上下文轮次
-
-阶段 3 还要额外补一条验证说明：
-
-1. 当前 [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js) 的
-   `contextStart = Math.max(0, startIdx - contextTurns * 2)`
-   本质上是按 chat index 偏移，不是按“真实可提取 turn 数”回溯
-2. 当中间夹杂真正 system 消息时，用户设置的 `extractContextTurns` 可能仍会少读
-
-这条不一定是 blocker，但阶段 3 验收必须补测试：
-
-1. 中间夹有真正 system 消息时，窗口是否仍符合用户对“最近 N 个 turn”的预期
-2. 若不符合，再决定是否把窗口算法从“index 偏移”升级成“按 assistant/user turn 回溯”
-
-### 阶段 4：只有在阶段 3 通过后，才移除 hide-engine 的本地 `is_system` 双写
-
-目标：
-
-1. 把隐藏引擎收敛成纯 `/hide` / `/unhide`
-
-建议动作：
-
-1. 在 [hide-engine.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\hide-engine.js) 删除或废弃：
-   - `markManagedSystemRange`
-   - `restoreManagedSystemFlags`
-   - `syncSystemAttribute`
-   - `__st_bme_hide_managed` 相关逻辑
-
-2. 保留：
-   - 范围计算
-   - slash command 调度
-   - 增量隐藏检查
-   - unhide 管理
-   - managed hide range 查询接口
-
-3. 重写相关测试，使其不再断言：
-   - “applyHideSettings 后 chat[i].is_system 被 BME 写成 true”
-
-而改为断言：
-
-1. 发出了正确的 `/hide` / `/unhide` 命令
-2. extraction 在隐藏开启时仍能读到配置窗口内的上下文
-3. `managedSystemIndices`（或其重命名版本）已从“本地双写追踪器”转成“managed hide range 状态”
-
----
-
-## 需要修改/复核的文件清单
-
-### 必改
-
-1. [chat-history.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\chat-history.js)
-   - 提取可见性判定的唯一真源
-
-2. [extraction-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\extraction-controller.js)
-   - 自动提取 / 手动提取 / reroll / replay 是否完整复用新判定
-
-3. [hide-engine.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\hide-engine.js)
-   - 最终收敛为纯 `/hide` / `/unhide`
-
-4. [tests\chat-history.mjs](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\tests\chat-history.mjs)
-   - 扩展为“宿主 `/hide` 产生的普通 system 化消息仍可被 extraction 读取”的测试
-
-5. [tests\hide-engine.mjs](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\tests\hide-engine.mjs)
-   - 重写对 `is_system` 的旧预期
-
-### 视范围决定是否同步调整
-
-1. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js)
-   - 任何仍影响 extraction 预判的 `is_system` 过滤
-
-2. [panel.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\panel.js)
-   - 仅确认配置语义，无需大改
-
-3. [recall-controller.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\recall-controller.js)
-4. [recall-persistence.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\recall-persistence.js)
-   - 建议暂不并入第一轮，除非后续验证发现 recall 也必须读取被隐藏楼层
-
-另外明确说明两处当前不建议改动：
-
-1. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js) 的 `getLatestUserChatMessage`
-2. [index.js](C:\Users\brian\OneDrive\Desktop\ST-Bionic-Memory-Ecology-past\index.js) 的 `getLastNonSystemChatMessage`
-
-原因：
-
-1. 这两处属于 recall / send-intent 输入整形
-2. 面向主 AI 可见尾部，而不是 extraction 读取窗口
-3. 当前保持按裸 `is_system` 跳过隐藏楼层是合理的，不应并入本次 extraction 解耦
-
----
-
-## 建议测试矩阵
-
-### A. 纯 extraction 语义
-
-1. 宿主 `/hide` 前后，同一条普通 assistant 消息都应仍可被提取窗口覆盖
-2. `extractContextTurns=2` 时，只读取目标 assistant 前固定窗口，不无限扩张
-3. 自动提取、手动提取、replay、reroll 的窗口语义一致
-4. 中间夹有真正 system 消息时，窗口语义是否仍满足“最近 N 个 turn”的产品预期
-
-### B. 隐藏与主 AI 可见性
-
-1. 开启旧楼层隐藏后，主 AI 仍只看到保留窗口
-2. BME 仍能从被隐藏楼层中拿到所需上下文
-3. BME 自动隐藏场景依赖的是 managed hide range，而不是宿主附加消息标记
-
-### C. 回归风险
-
-1. 不再因隐藏状态变化触发历史误恢复
-2. 自动提取在新聊天中继续正常推进
-3. 历史恢复后 extraction status 不再残留“AI 生成中”
-
----
-
-## 对另一个 AI 的最短结论
-
-> 用户的目标是“隐藏只负责 `/hide`，提取只负责按 `extractContextTurns` 读真实楼层窗口”。本次梳理已确认宿主 ST 的 `/hide` 本身就会把普通消息写成 `is_system=true`，因此不能靠删除 BME 本地 `is_system` 双写来完成解耦。当前最稳的阶段 2 主策略，不是继续寻找宿主附加标记，而是让 `hide-engine.js` 暴露 managed hide range 查询接口，由 extraction 按 index 反查“这个楼层是否是 BME 自动隐藏范围的一部分”，从而把 BME 自动隐藏的普通楼层与真正 system 消息区分开。只有在 extraction 彻底摆脱 `is_system` 依赖后，才能安全把 `hide-engine.js` 收敛成纯 `/hide` / `/unhide`。 
diff --git a/.claude/plans/recall-card-user-input-display-toggle-plan.md b/.claude/plans/recall-card-user-input-display-toggle-plan.md
deleted file mode 100644
index 989362f..0000000
--- a/.claude/plans/recall-card-user-input-display-toggle-plan.md
+++ /dev/null
@@ -1,406 +0,0 @@
-# ST-BME Recall Card 用户输入显示开关方案
-
-## 背景与用户痛点
-当前 ST-BME 在聊天楼层里会额外渲染一张 Recall Card，用来展示：
-
-- 本轮用户输入
-- 相关记忆召回
-- 召回节点数量
-- token 估算
-- 展开的召回图与注入内容
-
-这张卡目前是“额外附着在用户消息下面”的显示层，而不是替换原始用户消息本身。因此会出现一个明显问题：
-
-- 聊天界面里先看到原始用户输入
-- Recall Card 里又重复显示一遍“本轮用户输入”
-
-结果就是视觉重复。尤其对那些本来就自己做了用户输入栏美化的使用者来说，这张卡顶部的“本轮用户输入”区域会和现有前端样式冲突，形成一个突兀的“黄框重复展示”。
-
-用户的核心诉求有两个：
-
-1. “美化用户输入”必须变成可选项，不能强制显示。
-2. 如果用户选择“要显示美化后的用户输入”，那就必须同步隐藏原始用户输入，不能出现两份一模一样的文本并排或上下重复。
-
-重要边界：
-
-- 当前插件功能实际上是可用的，问题主要在显示策略。
-- 不要改召回逻辑、注入逻辑、持久化逻辑、图谱逻辑、检索逻辑。
-- 这是一个 UI 显示层改造，不是功能链路重写。
-
-## 已定位结论
-这个问题已经确认是前端展示层造成的，不是后端或 prompt 注入重复。
-
-### 1. 黄框来源
-Recall Card 本体由 [recall-message-ui.js](../../recall-message-ui.js) 创建：
-
-- `createRecallCardElement(...)` 负责生成整张卡
-- 其中“本轮用户输入”部分是直接写死渲染的
-
-关键位置：
-
-- [recall-message-ui.js:183](../../recall-message-ui.js#L183)
-- [recall-message-ui.js:203](../../recall-message-ui.js#L203)
-- [recall-message-ui.js:207](../../recall-message-ui.js#L207)
-
-### 2. 黄框样式来源
-Recall Card 的外观样式在 [style.css](../../style.css)：
-
-- 卡片容器： [style.css:2777](../../style.css#L2777)
-- 用户输入 label： [style.css:2787](../../style.css#L2787)
-- 用户输入文本： [style.css:2797](../../style.css#L2797)
-
-### 3. 卡片挂载方式
-Recall Card 不是一条新消息，也不是替换原消息。
-它是附加在原始 user 楼层 DOM 下面：
-
-- 锚点解析： [index.js:1822](../../index.js#L1822)
-- 卡片挂载： [index.js:1999](../../index.js#L1999)
-
-而且传入卡片的 `userMessageText` 就是原始 `message.mes`：
-
-- [index.js:2002](../../index.js#L2002)
-
-### 4. 后端/数据链路没有重复注入
-Recall Card 展示的数据来自用户消息上的持久化 recall 记录，不是额外造了一条消息：
-
-- 读取持久化记录： [recall-persistence.js:24](../../recall-persistence.js#L24)
-- 只要有 `injectionText` 才渲染卡片： [index.js:1952](../../index.js#L1952)
-
-因此，用户在酒馆后端看到的“只有用户输入 + 调回的记忆”这一观察是对的。现在的重复只发生在前端视觉层。
-
-## 目标
-在不改变 ST-BME 现有功能链路的前提下，为 Recall Card 增加一个“美化用户输入”的显示策略开关。
-
-最终需要满足：
-
-- 用户可以关闭 Recall Card 顶部那块“本轮用户输入”展示
-- 用户也可以保留这块美化展示
-- 当保留美化展示时，要自动隐藏原始 user 消息文本，避免视觉重复
-- 当关闭美化展示时，要确保原始 user 消息文本正常显示
-- 不影响记忆召回、持久化、注入、展开图谱、编辑、删除、重跑召回等现有能力
-
-## UI 放置要求
-用户指定要把“美化用户输入”的选项放在“功能开关”页，位置参考截图中的空位。
-
-建议放置方式：
-
-- 放在“隐藏旧楼层”这张卡附近
-- 作为同级的新配置卡，或作为该区域右侧空位中的独立卡片
-- 文案应一眼说明“这只是显示策略，不影响召回本身”
-
-建议标题：
-
-- `美化用户输入`
-
-建议副说明：
-
-- `控制 Recall Card 是否接管本轮用户输入的展示方式，不影响实际召回与注入。`
-
-## 推荐方案
-不要只做一个简单布尔值。更稳妥的是做成一个三态“显示模式”，这样另一位实现 AI 会更容易避免歧义。
-
-建议新增设置字段：
-
-- `recallCardUserInputDisplayMode`
-
-建议取值：
-
-1. `off`
-   不在 Recall Card 内显示“本轮用户输入”区域。
-   原始 user 消息保持原样显示。
-
-2. `beautify_only`
-   在 Recall Card 内显示“本轮用户输入”区域。
-   同时隐藏原始 user 消息文本。
-   这是最符合当前用户诉求的模式。
-
-3. `mirror`
-   在 Recall Card 内显示“本轮用户输入”区域。
-   原始 user 消息也继续显示。
-   这个模式保留当前行为，作为兼容选项。
-
-默认值建议：
-
-- 为兼容旧版本与已有用户习惯，默认值建议设为 `mirror`
-
-原因：
-
-- 不会改变现有安装用户的默认视觉结果
-- 只是新增可选项，不会破坏已有使用体验
-- 用户可以手动切换成自己想要的模式
-
-如果维护者更希望新装即减少视觉重复，也可以考虑默认 `off`。但那属于产品决策，不是技术必须。
-
-## 最小改动原则
-这次改动必须严格限制在“显示层”和“设置层”。
-
-允许改动：
-
-- `index.js`
-- `panel.html`
-- `panel.js`
-- `recall-message-ui.js`
-- `style.css`
-
-不要改动：
-
-- `recall-controller.js`
-- `retriever.js`
-- `injector.js`
-- `recall-persistence.js`
-- 任何召回算法、注入算法、存储结构、图谱结构
-
-## 实施方案
-
-### 一、设置层
-在 [index.js](../../index.js) 的默认设置中新增字段：
-
-- 位置： [index.js:343](../../index.js#L343)
-- 新增：`recallCardUserInputDisplayMode: "mirror"`
-
-要求：
-
-- 通过现有 `getSettings()` 和 `updateModuleSettings()` 走统一设置链路
-- 不新增独立存储机制
-- 不改服务端设置保存结构的总体行为，只是增加一个普通字段
-
-### 二、配置面板层
-在“功能开关”页面增加“美化用户输入”设置入口。
-
-建议实现方式：
-
-- 在 [panel.html](../../panel.html) 的 `toggles` 区块中新增一张配置卡
-- 位置靠近“隐藏旧楼层”卡片，使用截图中右侧空位
-- 在 [panel.js](../../panel.js) 中补充读写绑定
-
-建议交互形式：
-
-- 使用 `select`
-- 三个选项分别对应：
-  - `关闭美化，仅显示原始输入`
-  - `由 Recall Card 接管显示，并隐藏原始输入`
-  - `Recall Card 与原始输入同时显示（兼容模式）`
-
-为什么不建议只放 checkbox：
-
-- 因为 checkbox 很难同时表达“关闭”“替代”“保留重复”三种模式
-- 三态更清楚，也更利于向后兼容
-
-如果 UI 组件层面确实只适合 checkbox，也可以退化为：
-
-- `启用用户输入美化`
-- `启用后隐藏原始用户输入`
-
-但三态仍然是首选。
-
-### 三、Recall Card 渲染层
-在 [recall-message-ui.js](../../recall-message-ui.js) 里，只改“本轮用户输入”这块的渲染条件，不动其他内容。
-
-具体要求：
-
-- `createRecallCardElement(...)` 增加一个新的显示模式参数
-- `updateRecallCardData(...)` 也能同步接收该模式
-- 当模式为 `off` 时：
-  - 不创建 `userLabel`
-  - 不创建 `userText`
-  - 或者创建后直接隐藏，但更推荐不创建
-- 当模式为 `beautify_only` 或 `mirror` 时：
-  - 保持现有用户输入区渲染
-
-不要改动：
-
-- 召回条
-- 节点数 badge
-- token hint
-- 展开/折叠
-- 图谱渲染
-- 注入文本展示
-- 编辑/删除/重跑召回按钮逻辑
-
-### 四、原始用户输入隐藏层
-这部分是本次方案的关键，也是最容易误伤其他逻辑的地方。
-
-目标：
-
-- 只隐藏原始 user 消息正文文本
-- 不能把整条 `.mes` 或 `.mes_block` 隐藏掉
-- 否则 Recall Card 自己也会跟着消失
-
-建议做法：
-
-1. 在 `index.js` 的 Recall Card 刷新流程中，拿到目标 `messageElement` 后：
-   - 定位其原始文本容器，优先找 `.mes_text`
-2. 根据 `recallCardUserInputDisplayMode` 决定是否给该文本容器加一个 ST-BME 专用 class 或 data attribute
-3. 在 `style.css` 里为这个专用 class 提供隐藏样式
-
-建议新增 class：
-
-- `bme-hide-original-user-text`
-
-建议样式原则：
-
-- 仅隐藏文本区域本身
-- 不要影响按钮区、头像区、楼层容器尺寸计算
-
-这里推荐优先用“受控 class 切换”，不要直接写行内 `display:none`，原因是：
-
-- 刷新时更容易恢复
-- DOM 重绘后更容易重新应用
-- 更利于调试
-
-强制实现约束：
-
-- 只能在当前目标楼层的 `messageElement` 作用域内查找 `.mes_text`
-- 推荐写法是 `messageElement.querySelector('.mes_text')`
-- 不允许使用 `document.querySelectorAll('.mes_text')`、全局批量扫描后再按索引猜测匹配对象，或任何会波及其他楼层的全局操作
-
-原因：
-
-- 这个需求只应该影响“当前挂载 Recall Card 的那一条 user 楼层”
-- 如果实现成全局 `.mes_text` 操作，最容易出现误隐藏其他消息、切换模式后残留、以及聊天重绘时状态串楼层的问题
-
-### 五、刷新与恢复逻辑
-Recall Card UI 不是一次性静态渲染，而是会随消息刷新、设置变更、聊天切换重新挂载或更新。
-
-因此必须保证：
-
-- 切到 `beautify_only` 时，已存在的卡片能立即隐藏原始输入
-- 切到 `off` 或 `mirror` 时，已隐藏的原始输入能立即恢复
-- 删除 Recall Card 时，原始输入也要恢复
-- 聊天切换或楼层 DOM 重建后，显示状态能重新正确应用
-
-建议实现策略：
-
-- 在 `refreshPersistedRecallMessageUi()` 流程中统一应用
-- 在 `cleanupRecallArtifacts(...)` / `cleanupRecallCardElement(...)` 附近补一层“恢复原始文本显示”的兜底
-- 在设置更新时，若 patch 包含 `recallCardUserInputDisplayMode`，主动触发一次 Recall Card UI refresh
-
-## 兼容性要求
-
-### 必须保持不变
-- Recall 是否执行
-- Recall 结果如何写入持久化记录
-- 注入文本如何进入 prompt
-- token 估算
-- 展开的节点图
-- 编辑 recall 注入文本
-- 删除 recall 记录
-- 重跑 recall
-- 非 user 楼层不挂载 Recall Card 的规则
-
-### 必须新增保证
-- 无论用户怎样切换这个显示模式，都不能影响后端实际发送内容
-- 无论用户怎样切换这个显示模式，都不能让 recall 记录丢失
-- 无论用户怎样切换这个显示模式，都不能改变注入结果
-
-## 建议验收场景
-另一位实现 AI 可以按下面场景验收。
-
-### 场景 1：兼容模式
-设置为 `mirror`
-
-期望：
-
-- 行为与当前版本一致
-- 原始用户输入可见
-- Recall Card 顶部“本轮用户输入”也可见
-
-### 场景 2：关闭美化
-设置为 `off`
-
-期望：
-
-- 原始用户输入可见
-- Recall Card 仍保留“相关记忆召回”条、节点数、token、展开内容
-- 只是顶部“本轮用户输入”区域不再显示
-
-### 场景 3：美化接管
-设置为 `beautify_only`
-
-期望：
-
-- 原始用户输入文本被隐藏
-- Recall Card 顶部“本轮用户输入”仍显示
-- 聊天界面不再看到两份重复文本
-
-### 场景 4：设置动态切换
-在已有聊天记录上来回切换三种模式
-
-期望：
-
-- 不需要重开聊天
-- UI 立即生效
-- 不出现隐藏状态残留
-
-### 场景 5：删除 recall 记录
-在 `beautify_only` 模式下删除某条 Recall Card
-
-期望：
-
-- Recall Card 消失
-- 原始用户输入文本恢复显示
-
-### 场景 6：刷新 / 切聊天 / 重新挂载
-
-期望：
-
-- 模式设置持久生效
-- DOM 重建后显示仍然正确
-
-### 场景 7：多条消息并存时的作用域验证
-
-期望：
-
-- 在一个有多条 user 消息、且其中只有部分楼层存在 Recall Card 的聊天里
-- 切换 `beautify_only` 时，只隐藏挂载了 Recall Card 的目标楼层原始文本
-- 没有 Recall Card 的其他 user 楼层不得被隐藏
-- 切回 `off` 或 `mirror` 时，只恢复对应目标楼层，不出现跨楼层串改
-
-## 风险点与防误改提醒
-
-### 风险 1：误把整条消息隐藏
-如果实现时隐藏的是 `.mes`、`.mes_block` 或更外层容器，会把 Recall Card 自己也一起隐藏。
-
-正确做法：
-
-- 只处理原始用户文本区域
-- 而且这个文本区域必须通过当前 `messageElement` 局部查询获得，不能用全局 `.mes_text` 选择器批量处理
-
-### 风险 2：把显示问题误改成数据问题
-这个需求不是要删 `message.mes`，也不是要清理持久化 recall 记录。
-
-正确做法：
-
-- 只改 DOM 渲染与 class 切换
-
-### 风险 3：设置切换后残留隐藏状态
-如果只在创建卡片时加隐藏样式，而不在 refresh / cleanup 时恢复，会导致切换模式后文本状态错乱。
-
-正确做法：
-
-- 在刷新和清理路径都处理恢复逻辑
-
-### 风险 4：误动 Recall Card 其他区域
-用户只对“本轮用户输入这块美化显示”有意见，不是要取消整个 Recall Card。
-
-正确做法：
-
-- 只拆分顶部 user-input 区块的显示策略
-- 保留下面的 recall bar 与展开内容
-
-## 推荐实施顺序
-
-1. 在 `index.js` 增加默认设置字段
-2. 在 `panel.html` / `panel.js` 增加配置项，并放到“功能开关”页截图所示空位
-3. 在 `recall-message-ui.js` 给顶部 user-input 区块加显示模式控制
-4. 在 `index.js` 增加“隐藏/恢复原始 user 文本”的 DOM 协调逻辑
-5. 在 `style.css` 增加专用隐藏 class
-6. 跑一轮上述验收场景
-
-## 给实现 AI 的一句话总结
-这次改动的本质是：
-
-- 保留 Recall Card 功能
-- 只把 Recall Card 顶部“本轮用户输入”的显示变成可选
-- 并在“由 Recall Card 接管显示”时隐藏原始 user 文本
-- 不要动任何 recall / injection / persistence 的核心逻辑
diff --git a/style.css b/style.css
index 495af01..3c29965 100644
--- a/style.css
+++ b/style.css
@@ -2799,6 +2799,8 @@
   font-size: 14px;
   line-height: 1.6;
   color: var(--bme-on-surface, #e4e1e6);
+  white-space: pre-wrap;
+  overflow-wrap: anywhere;
   word-break: break-word;
 }
 
diff --git a/tests/p0-regressions.mjs b/tests/p0-regressions.mjs
index 9e1e49a..c3aa759 100644
--- a/tests/p0-regressions.mjs
+++ b/tests/p0-regressions.mjs
@@ -1662,6 +1662,76 @@ async function testRecallCardUserTextRefreshesWithoutCardRecreate() {
   }
 }
 
+async function testRecallCardDisplayModeToggleRestoresOriginalUserText() {
+  const chat = [
+    {
+      is_user: true,
+      mes: "line-1\nline-2",
+      extra: {
+        bme_recall: buildPersistedRecallRecord({
+          injectionText: "recall-0",
+          selectedNodeIds: ["n1"],
+          nowIso: "2026-01-01T00:00:00.000Z",
+        }),
+      },
+    },
+  ];
+  const harness = await createRecallUiHarness({ chat });
+  const messageElement = createMessageElement(harness.document, 0, {
+    stableId: true,
+    withMesBlock: true,
+    isUser: true,
+  });
+  const userTextElement = messageElement.querySelector(".mes_text");
+  userTextElement.textContent = chat[0].mes;
+  harness.chatRoot.appendChild(messageElement);
+
+  try {
+    harness.context.getSettings = () => ({
+      panelTheme: "crimson",
+      recallCardUserInputDisplayMode: "beautify_only",
+    });
+    harness.api.refreshPersistedRecallMessageUi();
+
+    let card = harness.chatRoot.querySelector(".bme-recall-card");
+    assert.equal(card?.dataset.userInputDisplayMode, "beautify_only");
+    assert.equal(
+      userTextElement.classList.contains("bme-hide-original-user-text"),
+      true,
+    );
+    assert.equal(
+      card?.querySelector(".bme-recall-user-text")?.textContent,
+      "line-1\nline-2",
+    );
+
+    harness.context.getSettings = () => ({
+      panelTheme: "crimson",
+      recallCardUserInputDisplayMode: "mirror",
+    });
+    harness.api.refreshPersistedRecallMessageUi();
+
+    card = harness.chatRoot.querySelector(".bme-recall-card");
+    assert.equal(card?.dataset.userInputDisplayMode, "mirror");
+    assert.equal(
+      userTextElement.classList.contains("bme-hide-original-user-text"),
+      false,
+    );
+
+    delete chat[0].extra.bme_recall;
+    harness.api.refreshPersistedRecallMessageUi();
+    assert.equal(
+      userTextElement.classList.contains("bme-hide-original-user-text"),
+      false,
+    );
+    assert.equal(
+      harness.chatRoot.querySelectorAll(".bme-recall-card").length,
+      0,
+    );
+  } finally {
+    harness.restoreGlobals();
+  }
+}
+
 function makeEvent(seq, title) {
   return createNode({
     type: "event",
@@ -4277,6 +4347,7 @@ await testRecallCardDoesNotMountOnNonUserFloor();
 await testRecallCardRefreshCleansLegacyBadgeAndAvoidsDuplicates();
 await testRecallCardExpandedContentRerendersAfterRecordUpdate();
 await testRecallCardUserTextRefreshesWithoutCardRecreate();
+await testRecallCardDisplayModeToggleRestoresOriginalUserText();
 await testRecallSubGraphAndDataLayerEntryPoints();
 await testRerollUsesBatchBoundaryRollbackAndPersistsState();
 await testHistoryRecoveryAbortClearsVectorRepairState();