有没有多音字处理准确的公开拼音数据与工具

目前我能找到的最好的方案是 GitHub - mozillazg/python-pinyin: 汉字转拼音(pypinyin)

其使用的数据文件也是同一个项目维护者在维护的 GitHub - mozillazg/phrase-pinyin-data: 词语拼音数据

看项目介绍发现其来源数据也比较繁杂,同时经过我粗略 选取比如 高考语文必备 | 92个常考易错多音字,快来查查!_ng_ch_ji 中的文本测试 结果虽差强人意也不尽如人意。

抱着侥幸的心理来论坛问问,希望得到有细心研究过这个问题的朋友指引指引。

汉字作为语言领域的独苗苗特例(如果不算Emoji的话),因为不是记录声音的文本,所以其读音自古以来就有其相当的灵活性与当代性。目前中国大陆的正确读音事实上也是有国家标准的,也就是《普通话异读词审音表》(有多个版本)。

有论坛的朋友知道有哪个公开的项目提供整理好的数据和工具可以用于将国语汉字转换为正确的拼音吗?

https://club.excelhome.net/thread-369617-1-1.html

做不到,至少目前我真的没见过能正确识别多音字的工具……

以原神的词库为例,现在我直接硬生生把所有多音字组合用程序写出来了,不然压根搞不定多音字配对的问题……

主要是很多词汇,确实是少用、且可以有多种解释,或者说就是生造的词压根没有标准拼音,只能靠人为规定……


对了,如果有能搞定的工具也推荐一下我试试,我这边天天搞原神词库搞得头都大了