案记索图——根据图片中的文本内容搜索图片（windows）【软件加加系列-第1弹】

dog · 2023 年4 月 27 日 09:10

软件名称

案记索图 0.1版

应用平台

Windows

一句简介

「案记索图」让你根据图片里的文本来搜索本地图片，就像微信、ios图库、谷歌图库一般，但不用联网。

应用简介

「案记索图」是一段autohotkey所写的小工具，将开源软件：
Umi-OCR: OCR图片转文字识别软件，完全离线。截屏/批量导入图片，支持多国语言、合并段落、竖排文字。可排除水印区域，提取干净的文本。基于 PaddleOCR 。
与老牌搜索软件
Everything：基于名称快速定位文件和文件夹。
进行了逻辑连接，实现了根据图片内文本内容查找图片的功能。

官方网站

当前页面

下载

下载Umi-OCR 1.3.4 、 Everything。
下载案记索图，解压。
地址： dogbean.ysepan.com

配置

打开Umi-OCR，按照如下进行设置

image362×644 29.4 KB

（按需勾选递归子文件夹设置。）

将目标图片文件夹拖入批量处理页面，导入完毕后，点击开始任务，放到后台耐心等待。
等待识别结束，将其他图片文件夹进行同样的操作。这时，可以发现图片文件夹下每个有字的图片都有一个同名的txt文件。

image750×314 76.9 KB
用记事本打开案记索图文件夹下的setting.ini，将所有的图片文件夹路径添加到其中，并在头部添加0或者1。
1代表递归查找该文件夹，0代表只查找该文件夹而不查找内部文件夹。

运行收集txt.exe，将之前所有生成的txt收集到“案记”文件夹中。
配置结束

使用

运行案记索图.exe
打开everything，设置视图为大图标（更方便）。
按下快捷键 ctrl + alt +f，跳出搜索框，输入关键词，按下回车，哦了~

说明2

Qingwa · 2023 年4 月 27 日 09:10

这么高级了啊

SystemRoot · 2023 年4 月 28 日 04:36

@dog
提个建议，你可以用这个代替Umi-OCR，这样更简单。
可以实现自动化。
这是个命令行工具，与Umi-OCR是一个作者
Umi-OCR就是调用的PaddleOCR_json

摘抄一点

简单试用

双击打开 PaddleOCR_json.exe 。等程序初始化完毕输出OCR init completed.后，直接输入图片路径，回车。（此时不允许输入中文路径，通过API调用时可以。）
…
返回值说明

通过API调用一次OCR，无论成功与否，都会返回一个字典。

字典中，根含两个元素：状态码code和内容data。在设置了热更新的回合，还会含有额外元素：更新日志hotUpdate。

状态码code为整数，每种状态码对应一种情况：

100 识别到文字

data内容为数组。数组每一项为字典，含三个元素：

text ：文本内容，字符串。

box ：文本包围盒，长度为4的数组，分别为左上角、右上角、右下角、左下角的[x,y]。整数。

score ：识别置信度，浮点数。

例：
  {'code':100,'data':[{'box':[[13,5],[161,5],[161,27],[13,27]],'score':0.9996442794799805,'text':'飞舞的因果交流'}]}

更多去作者 github 看吧

syun · 2023 年4 月 28 日 05:08

报错了

而且有一部分重名不同路径的文件怎么办

dog · 2023 年4 月 28 日 05:11

额，打包了错误版本，我重新打包一下zip。。。

没关系，发往everything的文件名是带路径的，不光是文件名

dog · 2023 年4 月 28 日 05:15

之前打包的收集txt.exe错误了，缺了个括号。。。
请下载新打包的版本

@all users

syun · 2023 年4 月 28 日 05:33

目前有个问题，我是杂项文件夹，那么文件夹内已有的txt文件也会被移动到索引目录中，导致文件被异常移动，可不可以添加个限制，移动指定时间范围内的txt文件，过滤掉以前的文件

dog · 2023 年4 月 28 日 05:40

你说的有道理，我试试0.2版本搞定。

syun · 2023 年4 月 28 日 05:42

我有一大堆图片资料需要查找以前是依靠文件名和路径现在简单了这个小脚本挺好的

summer_froth · 2023 年4 月 28 日 05:54

感谢分享

Lu_Rodney · 2023 年4 月 28 日 14:32

哦了~完美解决我的问题，十分强大 tq

EAea · 2023 年4 月 29 日 03:01

没有固定的图片文件夹，这个用处就变的很有限了。

dog · 2023 年4 月 29 日 03:12

其实也好办，
把软件改一改，
让txt保留在图片文件夹里而不是统一移动到案记文件夹里。
并且每次识别的时候如果已经有对应txt的话，就跳过，只识别新增的图片文件。

之后版本我把这功能做上

vebee · 2023 年4 月 29 日 08:07

相当的高级呀这是~~~~~~~~~~~~~~~~

Shawlj · 2023 年4 月 29 日 12:43

EV被你们玩出新花样了

Izual_Yang · 2023 年5 月 2 日 00:50

索引流程也太手动了，不应该是“在案记索图中添加文件夹→在UmiOCR中识别目录中的图片→收集TXT（创建符号链接）→运行案记索图.exe”这个顺序吗。

dog · 2023 年5 月 2 日 00:54

现在欠缺一体化话说umi ocr支持命令行模式我之后试试通过命令行调用一体化一下

MAKER555 · 2023 年5 月 2 日 02:42

强，如果能扩展到所有的盘都能搜索就实在强了

Izual_Yang · 2023 年5 月 2 日 04:54

这反而不现实，万一有海量图片……

syun · 2023 年5 月 3 日 11:31

这个方案有个问题，大批量的图片识别会占用比较高的系统资源，而且是长时间占用，真一体化的话没有进度条会很焦躁，如此说来还不如首次手动索引，后面添加增量索引就行了

话题		回复	浏览量
择文看图器1.0——类似微信看图，直接从图片上选取复制OCR文本发现频道 🔎 appinned , windows	0	3629	2023 年6 月 17 日
提取PC端微信看图功能问题求助❓ windows	21	5384	2023 年6 月 9 日
有没有类似“你写我读”的软件，打一个字读一个字的？问题求助❓	10	3921	2024 年1 月 9 日
求助，如果要写一个模拟点击的功能，用哪个工具最方便，功能最强大？问题求助❓ windows	24	421	2024 年11 月 6 日
Windows下有什么软件可以批量复制软件界面上显示的文本？问题求助❓	8	1482	2022 年12 月 7 日

案记索图——根据图片中的文本内容搜索图片（windows）【软件加加系列-第1弹】

软件名称

应用平台

推荐类型

一句简介

应用简介

官方网站

下载

配置

使用

`100` 识别到文字

案记索图——根据图片中的文本内容搜索图片（windows）【软件加加系列-第1弹】

软件名称

应用平台

推荐类型

一句简介

应用简介

官方网站

下载

配置

使用

100 识别到文字

Related topics

`100` 识别到文字