feat: pin_cand_filter.lua 置顶候选项 #586

This commit is contained in:
Dvel
2024-02-01 00:30:17 +08:00
parent d3c47e922d
commit 86ebf99f4f
11 changed files with 447 additions and 202 deletions

View File

@@ -1,4 +1,5 @@
-- 置顶候选项
-- Powered By ChatGPT
local function isInList(list, str)
for i, v in ipairs(list) do
@@ -12,39 +13,105 @@ end
local M = {}
function M.init(env)
local config = env.engine.schema.config
env.name_space = env.name_space:gsub("^*", "")
local list = env.engine.schema.config:get_list(env.name_space)
-- 如果定义了 'da zhuan' 或 'da zhong' ,会自动生成 'da z' 和 'da zh'。
-- 然而,如果明确定义了 'da z' 或 'da zh',则会优先使用这些明确自定义的简码,用 set 来做判断。
local set = {}
for i = 0, list.size - 1 do
local preedit, texts = list:get_value_at(i).value:match("([^\t]+)\t(.+)")
if preedit and texts then
set[preedit] = true
end
end
-- 遍历要置顶的候选项列表,将其转换为 table 存储到 M.pin_cands
-- 'ta 他 她 它' → M.pin_cands["ta"] = {"", "她", "它"},
-- 'l 了 啦' → M.pin_cands["l"] = {"", ""}
-- 'ta 他 她 它' → M.pin_cands["ta"] = {"他", "她", "它"}
--
-- 对于词汇preedit 包含空格),同时生成简码的拼写(最后一个空格后的首字母),如:
-- 'ni hao 你好 拟好' → M.pin_cands["ni hao"] = {"你好", "拟好"}
local list = config:get_list(env.name_space)
-- → M.pin_cands["ni h"] = {"你好", "拟好"}
--
-- 如果最后一个空格后以 zh ch sh 开头,额外再生成 zh, ch, sh 的拼写,如:
-- 'zhi chi 支持' → M.pin_cands["zhi chi"] = {"支持"}
-- → M.pin_cands["zhi c"] = {"支持"}
-- → M.pin_cands["zhi ch"] = {"支持"}
--
-- 如果同时定义了 'da zhuan 大专' 'da zhong 大众',会生成:
-- M.pin_cands["da zhuan"] = {"大专"}
-- M.pin_cands["da zhong"] = {"大众"}
-- M.pin_cands["da z"] = {"大专", "大众"} -- 先写的排在前面
-- M.pin_cands["da zh"] = {"大专", "大众"} -- 先写的排在前面
--
-- 如果同时定义了 'da zhuan 大专' 'da zhong 大众' 且明确定义了简码形式 'da z 打字',会生成:
-- M.pin_cands["da zhuan"] = {"大专"}
-- M.pin_cands["da zhong"] = {"大众"}
-- M.pin_cands["da z"] = {"打字"} -- 明确定义的优先级更高
-- M.pin_cands["da zh"] = {"大专", "大众"} -- 没明确定义的,仍然按上面的方式生成
M.pin_cands = {}
for i = 0, list.size - 1 do
local code, texts = list:get_value_at(i).value:match("([^\t]+)\t(.+)")
if code and texts then
M.pin_cands[code] = {}
local preedit, texts = list:get_value_at(i).value:match("([^\t]+)\t(.+)")
if preedit and texts then
M.pin_cands[preedit] = {}
-- 按照配置生成完整的拼写
for text in texts:gmatch("%S+") do
table.insert(M.pin_cands[code], text)
table.insert(M.pin_cands[preedit], text)
end
-- 额外处理包含空格的 preedit增加最后一个拼音的首字母和 zh, ch, sh 的简码
if preedit:find(" ") then
local preceding_part, last_part = preedit:match("^(.+)%s(%S+)$")
if last_part then
-- 生成最后一个拼音的简码拼写(最后一个空格后的首字母),如 ni hao 生成 ni h
local p1 = preceding_part .. " " .. last_part:sub(1, 1)
-- 只在没有明确定义此简码时才生成,已有的追加,没有的直接赋值
if not set[p1] then
if M.pin_cands[p1] ~= nil then
for text in texts:gmatch("%S+") do
table.insert(M.pin_cands[p1], text)
end
else
M.pin_cands[p1] = M.pin_cands[preedit]
end
end
-- 生成最后一个拼音的 zh, ch, sh 的简码拼写(最后一个空格后以 zh ch sh 开头),如 zhi chi 生成 zhi ch
-- if last_part:match("^(zh|ch|sh)") then -- 😰 ChatGPT 诚欺我
if last_part:match("^zh") or last_part:match("^ch") or last_part:match("^sh") then
local p2 = preceding_part .. " " .. last_part:sub(1, 2)
-- 只在没有明确定义此简码时才生成,已有的追加,没有的直接赋值
if not set[p2] then
if M.pin_cands[p2] ~= nil then
for text in texts:gmatch("%S+") do
table.insert(M.pin_cands[p2], text)
end
else
M.pin_cands[p2] = M.pin_cands[preedit]
end
end
end
end
end
end
end
end
function M.func(input)
local pined = {}
local others = {}
local pined = {} -- 提升的候选项
local others = {} -- 其余候选项
local pined_count = 0
for cand in input:iter() do
local pins = M.pin_cands[cand.preedit]
if pins then
-- 给 pined 几个空字符串占位元素,后面直接 pined[idx] = cand 确保 pined 与 pins 顺序一致
if #pined < #pins then
for _ = 1, #pins do
local texts = M.pin_cands[cand.preedit]
if texts then
-- 给 pined 几个空字符串占位元素,后面直接 pined[idx] = cand 确保 pined 与 texts 顺序一致
if #pined < #texts then
for _ = 1, #texts do
table.insert(pined, '')
end
end
-- 要置顶的放到 pined 中,其余的放到 others
local ok, idx = isInList(pins, cand.text)
local ok, idx = isInList(texts, cand.text)
if ok then
pined[idx] = cand
pined_count = pined_count + 1
@@ -52,7 +119,7 @@ function M.func(input)
table.insert(others, cand)
end
-- 找齐了或者 others 太大了,就不找了,一般前 5 个就找完了
if pined_count == #pins or #others > 50 then
if pined_count == #texts or #others > 50 then
break
end
else