diff --git a/cn_dicts/base.dict.yaml b/cn_dicts/base.dict.yaml index 9c4a1bb..4da5e38 100644 --- a/cn_dicts/base.dict.yaml +++ b/cn_dicts/base.dict.yaml @@ -1559,6 +1559,7 @@ # 「一槌定音」→「一锤定音」 # 「屎壳螂」→「屎壳郎」 # 「一刀两段」→「一刀两断」 +# 「翁同和」→「翁同龢」 #/// --- name: base diff --git a/cn_dicts/ext.dict.yaml b/cn_dicts/ext.dict.yaml index c197307..eb0aca2 100644 --- a/cn_dicts/ext.dict.yaml +++ b/cn_dicts/ext.dict.yaml @@ -53653,6 +53653,8 @@ columns: 同时变了 100 同时响应 100 同时执行 100 +同时支持 100 +同时支持了 100 同时泛起了 100 同时落地 100 同时说 100 @@ -125611,6 +125613,7 @@ columns: 程序员们 100 程序员鼓励师 100 程序坞 100 +程序文件夹 100 程序猴 100 程序的 100 程廷羽 100 @@ -126540,6 +126543,7 @@ columns: 笛沙格 100 符不符合 100 符号映射 100 +符号标点 100 符号的假象 100 符号看象限 100 符号论 100 @@ -130796,7 +130800,6 @@ columns: 羽田秀吉 100 羽鳃鲐 100 翁倩玉 100 -翁同和 100 翁同龢 100 翁培伦 100 翁宇君 100 diff --git a/en_dicts/cn_en.dict.yaml b/en_dicts/cn_en.dict.yaml index 6dc94ae..980ff35 100644 --- a/en_dicts/cn_en.dict.yaml +++ b/en_dicts/cn_en.dict.yaml @@ -42,7 +42,6 @@ QQ邮箱 QQyouxiang QQ音乐 QQyinyue QQ拼音 QQpinyin QQ会员 QQhuiyuan -QQ音速 QQyinsu QQ好友 QQhaoyou QQ输入法 QQshurufa Dock栏 Docklan @@ -157,8 +156,8 @@ Beta版本 Betabanben AV女优 AVnvyou X战警 Xzhanjing YY语音 YYyuyin -A4纸 Asizhi -A4腰 Asiyao +A4纸 A4zhi +A4腰 A4yao N多 Nduo N多个 Nduoge N次 Nci @@ -199,7 +198,6 @@ P个图 Pgetu P一下 Pyixia 芭比Q babiQ 芭比Q了 babiQle -S级 Sji QQ堂 QQtang PIN码 PINma PUK码 PUKma @@ -265,10 +263,8 @@ Web开发 Webkaifa 圈X quanX Switch版 Switchban Switch版本 Switchbanben -A型 Axing A型血 Axingxue A血型 Axuexing -B型 Bxing B型血 Bxingxue B血型 Bxuexing AB型 ABxing @@ -442,7 +438,6 @@ X和Y XheY VIP卡 VIPka AAA级 AAAji 第N次 diNci -PIN码 PINma 发EMS faEMS DVD版 DVDban USB线 USBxian @@ -461,3 +456,8 @@ DJ舞曲 DJwuqu 开party kaiparty Chromium系 Chromiumxi Chrome系 Chromexi +QQ游戏 QQyouxi +QQ游戏大厅 QQyouxidating +QQ音速 QQyinsu +QQ飞车 QQfeiche +QQ三国 QQsanguo diff --git a/en_dicts/cn_en_double_pinyin.dict.yaml b/en_dicts/cn_en_double_pinyin.dict.yaml index d3fb659..309c68a 100644 --- a/en_dicts/cn_en_double_pinyin.dict.yaml +++ b/en_dicts/cn_en_double_pinyin.dict.yaml @@ -42,7 +42,6 @@ QQ邮箱 QQybxd QQ音乐 QQynyt QQ拼音 QQpnyn QQ会员 QQhvyr -QQ音速 QQynsu QQ好友 QQhkyb QQ输入法 QQuurufa Dock栏 Docklj @@ -157,8 +156,8 @@ Beta版本 Betabjbf AV女优 AVnvyb X战警 Xvjjy YY语音 YYyuyn -A4纸 Asivi -A4腰 Asiyk +A4纸 A4vi +A4腰 A4yk N多 Ndo N多个 Ndoge N次 Nci @@ -199,7 +198,6 @@ P个图 Pgetu P一下 Pyixw 芭比Q babiQ 芭比Q了 babiQle -S级 Sji QQ堂 QQth PIN码 PINma PUK码 PUKma @@ -265,10 +263,8 @@ Web开发 Webklfa 圈X qrX Switch版 Switchbj Switch版本 Switchbjbf -A型 Axy A型血 Axyxt A血型 Axtxy -B型 Bxy B型血 Bxyxt B血型 Bxtxy AB型 ABxy @@ -442,7 +438,6 @@ X和Y XheY VIP卡 VIPka AAA级 AAAji 第N次 diNci -PIN码 PINma 发EMS faEMS DVD版 DVDbj USB线 USBxm @@ -461,3 +456,8 @@ DJ舞曲 DJwuqu 开party klparty Chromium系 Chromiumxi Chrome系 Chromexi +QQ游戏 QQybxi +QQ游戏大厅 QQybxidaty +QQ音速 QQynsu +QQ飞车 QQfzie +QQ三国 QQsjgo diff --git a/en_dicts/cn_en_double_pinyin_abc.dict.yaml b/en_dicts/cn_en_double_pinyin_abc.dict.yaml index 47bdc14..7ad4079 100644 --- a/en_dicts/cn_en_double_pinyin_abc.dict.yaml +++ b/en_dicts/cn_en_double_pinyin_abc.dict.yaml @@ -42,7 +42,6 @@ QQ邮箱 QQybxt QQ音乐 QQycym QQ拼音 QQpcyc QQ会员 QQhmyp -QQ音速 QQycsu QQ好友 QQhkyb QQ输入法 QQvurufa Dock栏 Docklj @@ -157,8 +156,8 @@ Beta版本 Betabjbf AV女优 AVnvyb X战警 Xajjy YY语音 YYyuyc -A4纸 Asiai -A4腰 Asiyk +A4纸 A4ai +A4腰 A4yk N多 Ndo N多个 Ndoge N次 Nci @@ -199,7 +198,6 @@ P个图 Pgetu P一下 Pyixd 芭比Q babiQ 芭比Q了 babiQle -S级 Sji QQ堂 QQth PIN码 PINma PUK码 PUKma @@ -265,10 +263,8 @@ Web开发 Webklfa 圈X qpX Switch版 Switchbj Switch版本 Switchbjbf -A型 Axy A型血 Axyxm A血型 Axmxy -B型 Bxy B型血 Bxyxm B血型 Bxmxy AB型 ABxy @@ -442,7 +438,6 @@ X和Y XheY VIP卡 VIPka AAA级 AAAji 第N次 diNci -PIN码 PINma 发EMS faEMS DVD版 DVDbj USB线 USBxw @@ -461,3 +456,8 @@ DJ舞曲 DJwuqu 开party klparty Chromium系 Chromiumxi Chrome系 Chromexi +QQ游戏 QQybxi +QQ游戏大厅 QQybxidaty +QQ音速 QQycsu +QQ飞车 QQfqee +QQ三国 QQsjgo diff --git a/en_dicts/cn_en_double_pinyin_flypy.dict.yaml b/en_dicts/cn_en_double_pinyin_flypy.dict.yaml index 1c19744..5750614 100644 --- a/en_dicts/cn_en_double_pinyin_flypy.dict.yaml +++ b/en_dicts/cn_en_double_pinyin_flypy.dict.yaml @@ -42,7 +42,6 @@ QQ邮箱 QQyzxl QQ音乐 QQybyt QQ拼音 QQpbyb QQ会员 QQhvyr -QQ音速 QQybsu QQ好友 QQhcyz QQ输入法 QQuurufa Dock栏 Docklj @@ -157,8 +156,8 @@ Beta版本 Betabjbf AV女优 AVnvyz X战警 Xvjjk YY语音 YYyuyb -A4纸 Asivi -A4腰 Asiyc +A4纸 A4vi +A4腰 A4yc N多 Ndo N多个 Ndoge N次 Nci @@ -199,7 +198,6 @@ P个图 Pgetu P一下 Pyixx 芭比Q babiQ 芭比Q了 babiQle -S级 Sji QQ堂 QQth PIN码 PINma PUK码 PUKma @@ -265,10 +263,8 @@ Web开发 Webkdfa 圈X qrX Switch版 Switchbj Switch版本 Switchbjbf -A型 Axk A型血 Axkxt A血型 Axtxk -B型 Bxk B型血 Bxkxt B血型 Bxtxk AB型 ABxk @@ -442,7 +438,6 @@ X和Y XheY VIP卡 VIPka AAA级 AAAji 第N次 diNci -PIN码 PINma 发EMS faEMS DVD版 DVDbj USB线 USBxm @@ -461,3 +456,8 @@ DJ舞曲 DJwuqu 开party kdparty Chromium系 Chromiumxi Chrome系 Chromexi +QQ游戏 QQyzxi +QQ游戏大厅 QQyzxidatk +QQ音速 QQybsu +QQ飞车 QQfwie +QQ三国 QQsjgo diff --git a/en_dicts/cn_en_double_pinyin_mspy.dict.yaml b/en_dicts/cn_en_double_pinyin_mspy.dict.yaml index 7e069b1..1aad028 100644 --- a/en_dicts/cn_en_double_pinyin_mspy.dict.yaml +++ b/en_dicts/cn_en_double_pinyin_mspy.dict.yaml @@ -42,7 +42,6 @@ QQ邮箱 QQybxd QQ音乐 QQynyt QQ拼音 QQpnyn QQ会员 QQhvyr -QQ音速 QQynsu QQ好友 QQhkyb QQ输入法 QQuurufa Dock栏 Docklj @@ -157,8 +156,8 @@ Beta版本 Betabjbf AV女优 AVnvyb X战警 Xvjj; YY语音 YYyuyn -A4纸 Asivi -A4腰 Asiyk +A4纸 A4vi +A4腰 A4yk N多 Ndo N多个 Ndoge N次 Nci @@ -199,7 +198,6 @@ P个图 Pgetu P一下 Pyixw 芭比Q babiQ 芭比Q了 babiQle -S级 Sji QQ堂 QQth PIN码 PINma PUK码 PUKma @@ -265,10 +263,8 @@ Web开发 Webklfa 圈X qrX Switch版 Switchbj Switch版本 Switchbjbf -A型 Ax; A型血 Ax;xt A血型 Axtx; -B型 Bx; B型血 Bx;xt B血型 Bxtx; AB型 ABx; @@ -442,7 +438,6 @@ X和Y XheY VIP卡 VIPka AAA级 AAAji 第N次 diNci -PIN码 PINma 发EMS faEMS DVD版 DVDbj USB线 USBxm @@ -461,3 +456,8 @@ DJ舞曲 DJwuqu 开party klparty Chromium系 Chromiumxi Chrome系 Chromexi +QQ游戏 QQybxi +QQ游戏大厅 QQybxidat; +QQ音速 QQynsu +QQ飞车 QQfzie +QQ三国 QQsjgo diff --git a/en_dicts/cn_en_double_pinyin_ziguang.dict.yaml b/en_dicts/cn_en_double_pinyin_ziguang.dict.yaml index 2e272e4..4e72b12 100644 --- a/en_dicts/cn_en_double_pinyin_ziguang.dict.yaml +++ b/en_dicts/cn_en_double_pinyin_ziguang.dict.yaml @@ -42,7 +42,6 @@ QQ邮箱 QQyzxg QQ音乐 QQyyyn QQ拼音 QQpyyy QQ会员 QQhnyl -QQ音速 QQyysu QQ好友 QQhqyz QQ输入法 QQiurufa Dock栏 Docklr @@ -157,8 +156,8 @@ Beta版本 Betabrbw AV女优 AVnvyz X战警 Xurj; YY语音 YYyuyy -A4纸 Asiui -A4腰 Asiyq +A4纸 A4ui +A4腰 A4yq N多 Ndo N多个 Ndoge N次 Nci @@ -199,7 +198,6 @@ P个图 Pgetu P一下 Pyixx 芭比Q babiQ 芭比Q了 babiQle -S级 Sji QQ堂 QQts PIN码 PINma PUK码 PUKma @@ -265,10 +263,8 @@ Web开发 Webkpfa 圈X qlX Switch版 Switchbr Switch版本 Switchbrbw -A型 Ax; A型血 Ax;xn A血型 Axnx; -B型 Bx; B型血 Bx;xn B血型 Bxnx; AB型 ABx; @@ -442,7 +438,6 @@ X和Y XheY VIP卡 VIPka AAA级 AAAji 第N次 diNci -PIN码 PINma 发EMS faEMS DVD版 DVDbr USB线 USBxf @@ -461,3 +456,8 @@ DJ舞曲 DJwuqu 开party kpparty Chromium系 Chromiumxi Chrome系 Chromexi +QQ游戏 QQyzxi +QQ游戏大厅 QQyzxidat; +QQ音速 QQyysu +QQ飞车 QQfkae +QQ三国 QQsrgo diff --git a/en_dicts/en.dict.yaml b/en_dicts/en.dict.yaml index 8974ad0..3ff408d 100644 --- a/en_dicts/en.dict.yaml +++ b/en_dicts/en.dict.yaml @@ -18018,7 +18018,7 @@ struggling struggling struts struts # sts sts # stu stu -stuart stuart +Stuart Stuart stub stub stubborn stubborn stuck stuck diff --git a/en_dicts/en_ext.dict.yaml b/en_dicts/en_ext.dict.yaml index 613116a..8cf0fd3 100644 --- a/en_dicts/en_ext.dict.yaml +++ b/en_dicts/en_ext.dict.yaml @@ -111,10 +111,11 @@ Sunday Sun # 生活大爆炸 & 老友记 Sheldon Sheldon Leonard Leonard -Penny Penny Howard Howard -Bernadette Bernadette Rajesh Rajesh +Penny Penny +Bernadette Bernadette +Amy Amy Rachel Rachel Monica Monica Joey Joey diff --git a/opencc/others.txt b/opencc/others.txt index 2eb3e37..8d308a4 100644 --- a/opencc/others.txt +++ b/opencc/others.txt @@ -333,6 +333,10 @@ Sheldon Sheldon 谢尔顿 谢耳朵 Leonard Leonard 莱纳德 佩妮 佩妮 Penny Penny Penny 佩妮 +伯纳黛特 伯纳黛特 Bernadette +Bernadette Bernadette 伯纳黛特 +艾米 艾米 Amy +Amy Amy 艾米 霍华德 霍华德 Howard Howard Howard 霍华德 拉杰什 拉杰什 Rajesh diff --git a/others/cn_en.txt b/others/cn_en.txt index b6501fc..a19eea6 100644 --- a/others/cn_en.txt +++ b/others/cn_en.txt @@ -1,6 +1,6 @@ # 中英混输词库 # 根据此文件生成对应的 en_dicts/ 下的全拼及双拼词库 -# version: 2023-05-09 +# version: 2023-06-08 X光 X光片 X射线 @@ -32,7 +32,6 @@ QQ邮箱 QQ音乐 QQ拼音 QQ会员 -QQ音速 QQ好友 QQ输入法 Dock栏 @@ -147,7 +146,6 @@ Beta版本 AV女优 X战警 YY语音 -A4 A4纸 A4腰 N多 @@ -190,7 +188,6 @@ P个图 P一下 芭比Q 芭比Q了 -S级 QQ堂 PIN码 PUK码 @@ -256,10 +253,8 @@ Web开发 圈X Switch版 Switch版本 -A型 A型血 A血型 -B型 B型血 B血型 AB型 @@ -433,7 +428,6 @@ X和Y VIP卡 AAA级 第N次 -PIN码 发EMS DVD版 USB线 @@ -452,3 +446,8 @@ DJ舞曲 开party Chromium系 Chrome系 +QQ游戏 +QQ游戏大厅 +QQ音速 +QQ飞车 +QQ三国 diff --git a/others/script/main.go b/others/script/main.go index 68056ee..f018611 100644 --- a/others/script/main.go +++ b/others/script/main.go @@ -18,6 +18,10 @@ func main() { rime.CheckAndGenerateEmoji() fmt.Println("--------------------------------------------------") + // 从 others/cn_en.txt 更新中英混输词库 + rime.CnEn() + fmt.Println("--------------------------------------------------") + // 为 ext、tencent 没权重的词条加上权重,有权重的改为下面设置的权重 rime.AddWeight(rime.ExtPath, rime.DefaultWeight) rime.AddWeight(rime.TencentPath, rime.DefaultWeight) diff --git a/others/script/rime/cn_en.go b/others/script/rime/cn_en.go index 08d10cf..5324bf0 100644 --- a/others/script/rime/cn_en.go +++ b/others/script/rime/cn_en.go @@ -3,12 +3,14 @@ package rime import ( "bufio" "fmt" + mapset "github.com/deckarep/golang-set/v2" "log" "os" "path/filepath" "regexp" "strconv" "strings" + "time" "unicode" ) @@ -86,19 +88,32 @@ var polyphones = map[string]string{ "VIP卡 > 卡": "ka", "Chromium系 > 系": "xi", "Chrome系 > 系": "xi", + "QQ游戏大厅 > 大": "da", + "QQ飞车 > 车": "che", } var digitMap = map[string]string{ - "0": "ling", - "1": "yi", - "2": "er", - "3": "san", - "4": "si", - "5": "wu", - "6": "liu", - "7": "qi", - "8": "ba", - "9": "jiu", + // "0": "ling", + // "1": "yi", + // "2": "er", + // "3": "san", + // "4": "si", + // "5": "wu", + // "6": "liu", + // "7": "qi", + // "8": "ba", + // "9": "jiu", + // 数字的问题由英文方案的拼写派生解决了,暂时不用转换了 + "0": "0", + "1": "1", + "2": "2", + "3": "3", + "4": "4", + "5": "5", + "6": "6", + "7": "7", + "8": "8", + "9": "9", } type schema struct { @@ -377,6 +392,9 @@ var doublePinyinABC = schema{ // CnEn 从 others/cn_en.txt 生成全拼和各个双拼的中英混输词库 func CnEn() { + // 控制台输出 + defer printlnTimeCost("更新中英混输 ", time.Now()) + cnEnTXT, err := os.Open(filepath.Join(RimeDir, "others/cn_en.txt")) if err != nil { log.Fatalln(err) @@ -401,7 +419,8 @@ func CnEn() { writePrefix(schemas[i]) } - // 转换注音并写入 + // 转换注音并写入,顺便查重 + uniq := mapset.NewSet[string]() sc := bufio.NewScanner(cnEnTXT) for sc.Scan() { line := sc.Text() @@ -411,6 +430,11 @@ func CnEn() { if strings.TrimSpace(line) != line { fmt.Println("❌ 前后有空格", line) } + if uniq.Contains(line) { + fmt.Println("❌ 重复", line) + continue + } + uniq.Add(line) for _, schema := range schemas { code := textToPinyin(line, schema) _, err := schema.file.WriteString(line + "\t" + code + "\n") diff --git a/others/script/rime/错别字.txt b/others/script/rime/错别字.txt index 0e4fbe0..acb7621 100644 --- a/others/script/rime/错别字.txt +++ b/others/script/rime/错别字.txt @@ -1,3 +1,4 @@ +翁同和 林清霞 周惠敏 一刀两段