如何按姓氏笔画以及姓名笔画排序呢？

CCR · 2023 年10 月 12 日 13:05

如题，遇到了不同场景需要分别按姓氏笔画和姓名笔划排序……
但是大多程序不满足要求~~（指的就是贝特之姓氏笔画排序）~~，例如姓“类”的，“闫”的，很多少见姓氏都找不到……

求救有没有程序能帮忙的，要大字库，哪怕不像思源那么广，好歹GBK标准得满足吧……
~~（实在不行我就自己出手……但我只会python，效率太低，排个本班没问题，数据量一大直接完蛋……rust三过门槛而不入……）~~

为防止有人不知道“姓名笔划”和“姓氏笔画”的区别，特此说明如下：

详请

姓名笔划和姓氏笔画（“画”与“划”通假，不影响）：
基础道理就是比较文字笔画数多少，少的在前；同样的比较笔画顺序，横前竖后，详细顺序此处不继续列举，可自行百度

姓名排序是按姓和名依次比较的；复姓只以首字视为姓，不以笔画相加作比较
姓氏排序也是一个道理，但姓氏排序时两个字的人，例如张三，视为3个字，中间的字为空格

举例：
张三四和张三
按姓氏排，为“张（空格）四”与“张三四”，张（空格）三在前
按姓名排，“张四”与“张三四”，“张三四”在前

具体参见：https://baijiahao.baidu.com/s?id=1718735201680082283

Misaki_HameHame · 2023 年10 月 12 日 22:36

我觉得你已经把规则说的很清楚了。只差一个汉字和笔画数与笔画顺序的数据库。
这和你会什么编程语言似乎没有关系吧。

手动录入万个左右的姓氏，确定每一个汉字的笔画数。定义笔画顺序。
比如张姓和李姓都是7画，减少一点精度只定义前四个步骤，你可以定义横竖撇捺为1234，前者笔画为 1123，后者是1234。
按姓氏排序时，空格位顺序最优先。
按姓名排序时即按每个汉字的笔画数来排序。

只是得看你自己查找是否有人已经做了相关工作并开源出来。

zhongx · 2023 年10 月 12 日 23:10

这排序方法很复杂啊。
1、首先姓要单独拿出来解决，可简单定义为第一个字；可遇到复姓时，怎么准确知道前面哪两个字的组合为复姓？肯定会有漏网之鱼。（这才是重点）
2、先把 1 解决了，才能确定名的第一个字。
3、笔画数与笔顺反而是最好解决的，随便找个大字典，将词头与笔画数和笔顺提取出来就可以了，再将一（横）、丨（竖）、丿（撇）、丶（捺）、乛（折）定义为 12345 ，按数字就可以排序了。

CCR · 2023 年10 月 13 日 00:44

找了，没有找到开源的处理方案……

另，语言还是很重要的，50多人没问题，变成500，50000效率一下就体现出来了，python终究还是差点意思，并且还得手动打包依赖库手动精简体积，去了别人电脑还要想想依赖怎么处理啥的……

c，rust什么的就没这些烦恼，效率嘎嘎高

自己用肯定是py好，发出来就不好了……

CCR · 2023 年10 月 13 日 00:45

这反而简单，判断字数即可，2字一套方法，3字一套，3以上一套

~~复姓在这两套方法里面其实和“张王三四”这种名字一样，一视同仁处理的，复姓第二字会当做名的第一字处理……~~
我错了，确实姓氏笔画得按复姓算的……

CCR · 2023 年10 月 13 日 00:59

还要看左右还是上下，感觉难以处理，例如“王冕”和“王晚”
王晚在前，因左右结构……

zhongx · 2023 年10 月 13 日 01:01

这样处理复姓，实在是太残暴了。
同样在字典里提取，定义一下就好。

CCR · 2023 年10 月 13 日 01:49

刚刚发现了一点点小问题，我要先做程序，好像要先学习数据库要不然程序无从下手,以静态列表储存好像有点太奇怪了，并且也不好增添和修改，每次增添和修改都要重新发一版……

CataeroGong · 2023 年10 月 13 日 02:16

其实也不一定要用数据库，这个最核心的就是汉字笔画信息表，做成一个字典结构，放一个单独的数据文件（格式随意，比如 JSON），程序从这个文件读取到内存数据结构。到时候更新也就更新这一个文件就成。

开源的话，只需要开源这一个数据文件。

rain940815 · 2023 年10 月 13 日 03:44

教育部有专门的规范文件，直接去教育部官网下载就行，也有专门的排序软件，官方的各种名单，例如人大，政协这些就是用专门的软件处理的。

CCR · 2023 年10 月 13 日 06:06

我一直认为有，但始终没找到，老哥有链接吗……

CataeroGong · 2023 年10 月 13 日 08:09

我去教育部网站上搜了，GF3003-1999 GB13000.1字符集汉字字序（笔画序）规范，这应该是一本书，pdf 只是前几页示例

jack_w · 2023 年10 月 13 日 08:11

之前用python写中文自然排序时偶然找到的字库，不知道有没有用https://wwvb.lanzout.com/iGgGd1bowqrc

tempUserName · 2023 年10 月 13 日 09:24

馊主意：

使用在线服务，查完放入数据库，中国常用姓氏也不算很多，一次能查 12 个，百来次应该可以完成

CCR · 2023 年10 月 13 日 10:12

你这可太要命了啊，甚是不如把复姓单独挑出来以后，姓氏和名字分别用excel排序来的快啊

L11 · 2023 年10 月 13 日 11:30

找个讲姓氏的epub电子书，把目录页提取出来

Jreen · 2023 年10 月 13 日 12:10

ps

可以参考？

Jreen · 2023 年10 月 13 日 12:10

https://zhuanlan.zhihu.com/p/637751885
看看这个？感觉是你想要的功能

CCR · 2023 年10 月 13 日 12:27

看到力，但是还是想自己写一个，不开源或者不是官方出的软件处理较敏感信息时总有顾虑

xiaokonglong · 2023 年10 月 15 日 08:49

Word

可以按笔画排序.

word 的排序规则应该是:

先排序第一个字,
2 第一个字重复就排序第二个字. 以此类推

话题		回复	浏览量
程序设计包容性红黑榜网络黄页 cjk	10	1367	2023 年7 月 28 日
有没有多音字处理准确的公开拼音数据与工具问题求助	2	169	2026 年1 月 30 日
有没有方法可以查找部分同名的文件？问题求助	33	1933	2022 年12 月 8 日
求 Win 下复制文字后，自动统计字数并显示的工具问题求助 windows , 剪贴板	17	560	2024 年11 月 8 日
一行文字，怎么让中英文互换位置讨论分享	7	262	2024 年7 月 12 日

如何按姓氏笔画以及姓名笔画排序呢？

相关话题