dict: 完成同义多音字注音 close #353

This commit is contained in:
Dvel
2023-10-30 20:09:27 +08:00
parent bb0fdea74c
commit fa12fa4a02
16 changed files with 4491 additions and 2008 deletions

View File

@@ -21,9 +21,10 @@ func main() {
return
case "p":
rime.CheckPolyphone(rime.BasePath)
rime.CheckPolyphone(rime.ExtPath)
return
case "tp":
rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp"))
rime.Pinyin(filepath.Join(rime.RimeDir, "cn_dicts/temp.txt"))
return
}
}
@@ -53,6 +54,11 @@ func main() {
rime.Check(rime.TencentPath, 4)
fmt.Println("--------------------------------------------------")
// 检查同义多音字
rime.CheckPolyphone(rime.BasePath)
rime.CheckPolyphone(rime.ExtPath)
fmt.Println("--------------------------------------------------")
areYouOK()
SORT:

View File

@@ -18,9 +18,9 @@ func Temp() {
// GeneratePinyinTest("都挺长的")
// GeneratePinyinTest("血条长")
// findP(ExtPath, "")
Pinyin(ExtPath)
AddWeight(ExtPath, 100)
// findP(BasePath, "")
// Pinyin(ExtPath)
// AddWeight(ExtPath, 100)
}
// 列出字表中多音字的状况:是否参与自动注音
@@ -90,7 +90,7 @@ func polyphone() {
}
}
// 在字典中找到此行是否包含同义多音字,如果包含长度大于等于3从文件中删除这行并将所有删除的行写入到 1.txt 中
// 在词库中找到此行是否包含同义多音字,如果包含长度大于等于3从文件中删除这行并将所有删除的行写入到 1.txt 中
func findP(dictPath string, ch string) {
// open file
file, err := os.OpenFile(dictPath, os.O_RDWR, 0666)

View File

@@ -29,10 +29,12 @@ var polyphonicWords = []string{
// 不检查的词汇
var polyphonicWordsFilter = []string{
"咀嚼",
"薄暮", "薄地", "薄海", "薄酒", "薄礼", "薄面", "薄命", "薄情", "薄弱", "薄田", "薄物细故", "薄幸", "薄情", "薄葬", "厌薄", "厚积薄发", "履薄临深", "德薄望轻", "菲薄", "履薄", "孤军薄旅", "薄太后",
"剥离", "剥夺", "剥削", "剥落", "剥蚀", "剥啄",
"熟稔", "黄熟",
"咀嚼", "倒嚼", "嚼着", "咬文嚼字", "嚼用", "嚼服", "马嚼子", "嚼了", "干嚼", "边嚼边", "嚼舌", "嚼不了",
"淡薄", "姓薄", "微薄", "绵薄", "缘薄", "薄暮", "薄施", "薄言", "儇薄", "鄙薄", "薄的", "薄雾", "薄被", "浇薄", "薄膜", "德薄任重", "德浅行薄", "恶衣薄食", "片长薄技", "薄纸", "硗薄", "薄产", "浅薄", "薄技", "命薄", "薄利", "瘠薄", "凉薄", "薄待", "削薄", "稀薄", "薄地", "喷薄", "薄薪", "薄海", "薄酒", "薄礼", "刻薄", "薄面", "薄命", "磨薄", "薄情", "薄弱", "薄弱地带", "薄弱学校", "薄弱学校改造", "薄志弱行", "薄批细抹", "薄抹灰", "薄伽丘", "薄伽梵", "薄伽梵歌", "薄砂地", "赢得青楼薄幸名", "薄田", "薄物细故", "薄幸", "薄情", "薄葬", "厌薄", "厚积薄发", "履薄临深", "德薄望轻", "菲薄", "履薄", "孤军薄旅", "薄太后", "薄荷",
"剥离", "剥夺", "剥削", "剥落", "剥除", "吞剥", "撕剥", "剥茧", "剥蚀", "剥取", "剥脱", "剥啄", "剥开", "椎肤剥髓", "毕剥", "剥肤之痛", "环剥", "盘剥", "生吞活剥",
"熟稔", "黄熟", "谙熟", "熟思", "熟睡", "厮熟", "精熟", "熟虑", "熟字", "熟道", "腐熟", "熟地", "熟手", "熟漆", "熟语", "熟妇", "熟路", "熟识", "熟谙", "熟习", "常熟",
"爪哇", "爪儿", "鳞爪", "棘爪", "握爪", "爪子", "爪牙",
"差忒", "忒弥斯", "忒修斯", "破忒头", "安菲特里忒", "阿塔兰忒", "阿佛洛狄忒", "阿芙忒娜", "忒伊亚", "得墨忒耳", "欧忒耳佩",
}
// CheckPolyphone 检查 base、ext 中同义多音字是否有两种读音
@@ -79,7 +81,7 @@ func CheckPolyphone(dictPath string) {
// 遍历 m输出单数读音的词汇
for text, codes := range m {
if len(codes)%2 != 0 {
fmt.Println(text)
fmt.Println("⚠️ 同义多音字: " + text)
}
}
}

View File

@@ -1,4 +1,9 @@
# 在 # -_- 上面是错词;下面是包含错词但不是错词。
必剥
毛绒绒
斗志斗勇
翻云复雨
复雨翻云
目光所致
浒野关
贝克勒耳

View File

@@ -183,7 +183,7 @@
木强少文
# 南 na
南无
# 价 6138
# 价 jie
别价
甭价
不价
@@ -678,8 +678,37 @@
脉脉
# 似 shi
似的
# 劲 jin jing (全部注音)
# 劲 jing
兵劲城固
苍劲
正劲
刚劲
劲爆
强劲
劲草
劲拔
劲吹
劲敌
劲风
劲歌
劲酒
劲烈
劲旅
劲弩
劲峭
劲射
劲升
劲松
劲挺
劲舞
劲直
劲卒
前茅后劲
坚劲
清劲风
雄劲
直节劲气
# 咖 ga
咖喱
# 伯 bai
@@ -718,7 +747,6 @@
迫榴炮
# 壳 qiao
地壳
甲壳
脱壳
壳菜
壳斗