Regex_pics_del,一个根据正则分类并自动删除重复与较小项的软件

regex_pics_del

开源地址:

警告

本程序仅适用于图片等常规文件,代码文件等不在考虑范围内

原理

程序使用了正则表达式对文件(通常是图片)的文件名(不含后缀)的匹配项进行分组,通过遍历每组内的文件大小删除较小的文件,对于大小相同的文件将比较sha3_256值,相同的将自动删除

使用方法:

<程序地址.exe> <正则表达式> <要匹配的组> <文件夹(仅允许一个)>

示例:

现有如下图片:

D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#18435810.png
D:\Downloads\UI_Codex\UI_Codex_PhotoDisplayStand_08#2592427.png
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#2187382.png
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#2557.png
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#3239116.png
D:\Downloads\UI_Codex\UI_Codex_PhotoDisplayStand_08.png
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#67994.png
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu.png

文件名列表:

UI_Codex_Scenery_CYCengYanJuYuanZhu#18435810
UI_Codex_PhotoDisplayStand_08#2592427
UI_Codex_Scenery_CYCengYanJuYuanZhu#2187382
UI_Codex_Scenery_CYCengYanJuYuanZhu#2557
UI_Codex_Scenery_CYCengYanJuYuanZhu#3239116
UI_Codex_PhotoDisplayStand_08
UI_Codex_Scenery_CYCengYanJuYuanZhu#67994
UI_Codex_Scenery_CYCengYanJuYuanZhu

文件名列表正则匹配情况

分组情况:

---
UI_Codex_PhotoDisplayStand08
---
D:\Downloads\UI_Codex\UI_Codex_PhotoDisplayStand_08.png  7712kb
D:\Downloads\UI_Codex\UI_Codex_PhotoDisplayStand_08#2592427.png  8800kb

---
UI_Codex_SceneryCYCengYanJuYuanZhu
---
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#18435810.png  123kb
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#2187382.png  456kb
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#2557.png  678kb
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#3239116.png 789kb
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#67994.png 33kb
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu.png 789kb

最终结果

D:\Downloads\UI_Codex\UI_Codex_PhotoDisplayStand_08#2592427.png
D:\Downloads\UI_Codex\UI_Codex_Scenery_CYCengYanJuYuanZhu#3239116.png

感谢

感谢 https://regex101.com/ 提供了方便、易得、鲜明的正则检查

1 个赞

放个正脸图看看

仅cli:xk:

所以我能简单的说他是一个图片去重工具么

是否只匹配?刪或不刪由用戶決定?

最好是能找到「相似」的圖片或視頻。

同時,現在的這種軟件,如果不用點AI科技,就有點拿不出手…

可以,只是需要用户自己写正则罢了

自动删除

相似的我做不到……技术不过关
ai……更是不会……我只是一个医学生罢了,偶尔写点东西自己用用顺手发出来(

需要用户写正则!那你这玩意怎么用,我可是看了半天没看懂

我专门留出了正则的参数,就为了让程序自由化……

范例也看不懂吗(

如果需要自己写正则…就太难了

小众软件嘛,本来也没想着有多少人用(

有人也说了现在是 AI 的时代,那么用 AI 帮你生成正则表达式也是可以的吧,

我关心的是,如果大小相同,这个sha3_256值,会不会导致误删除有不一样的文件,如 Word 或者 Excel

确保正确的前提下,能全自动无干预进行删除,我觉得是个挺好的思路

类似名字删除小的文件,其实可以做一个选择开关,也可以删除大的。不过这个选项感觉用处不大,误删除可能性太大了,

如果大小相同,会比较sha值,如果sha一样才会删除,否则不处理。

SHA3_256目前还没有被破解,真让你在完全不知情的情况下生成两个完全一致的文件……比你中了100万彩票的概率还会低的(


此外,如果担心word、excel被误删,一开始就应该在正则表达式里面表现出来啊 :xk: 我开放自定义正则就是为了让大家能自由地对自己需要管理的文件进行分组的

最关键的是,我一开始就说了啊,仅推荐用于图片,文件名也是pic,本身就不是很推荐你用它筛选代码什么的啊 :wl:

我更多的需求是整理文件,而不是删除文件,下载到相同文件导致重复的可能性并不大

不知道有没有类似的工具:根据正则匹配规则,把文件移动到对应的文件夹

改改就行,一个函数一个文件名加个后缀而已