目前我能找到的最好的方案是 GitHub - mozillazg/python-pinyin: 汉字转拼音(pypinyin) 。
其使用的数据文件也是同一个项目维护者在维护的 GitHub - mozillazg/phrase-pinyin-data: 词语拼音数据 。
看项目介绍发现其来源数据也比较繁杂,同时经过我粗略 选取比如 高考语文必备 | 92个常考易错多音字,快来查查!_ng_ch_ji 中的文本测试 结果虽差强人意也不尽如人意。
抱着侥幸的心理来论坛问问,希望得到有细心研究过这个问题的朋友指引指引。
汉字作为语言领域的独苗苗特例(如果不算Emoji的话),因为不是记录声音的文本,所以其读音自古以来就有其相当的灵活性与当代性。目前中国大陆的正确读音事实上也是有国家标准的,也就是《普通话异读词审音表》(有多个版本)。
有论坛的朋友知道有哪个公开的项目提供整理好的数据和工具可以用于将国语汉字转换为正确的拼音吗?