求个能命令行导入图像后OCR并排显示的工具

cngych · 2024 年3 月 23 日 14:46

求个能不驻留内存的支持命令行导入图像后自动OCR显示图像和文本的，像 Snipping_OCR 或者 Umi-OCR 那样的 https://github.com/sangyuxiaowu/Snipping_OCR

不知道有没有大神能撸个更高级的，像是使用 Screenpresso.exe capture --action ScreenshotRegion --filepath "G:\output.png" --quit 命令执行后将图像导入到 ABBYY FineReader\FineCmd.exe G:\output.png" /lang ChinesePRC English /out %userprofile%\Desktop\result.txt /quit" 最后并排显示 G:\output.png 和 %userprofile%\Desktop\result.txt 的工具

CCR · 2024 年3 月 23 日 14:47

格式不符合，我给你修了；发帖不要发到小问答里面，发到公开版面，下次注意。

虽然哪怕我给你修了也还是看不懂你在讲啥，烦请分拆问题以便理解。

例如：

我希望用命令行导入一个XX样子的图像到哪里
如何让两张图片并排显示
……

目前我的解决方案是：

……
……

有哪些不完美的地方：
……

cngych · 2024 年3 月 23 日 14:51

好的，谢谢。

cngych · 2024 年3 月 27 日 14:20

这个需求源自摘录网络图片或者软件界面中的文本遇到的几种情况：

1.把浏览器中的一张图片拖拽到桌面，再从桌面拖拽到能够处理命令行导入的图像程序中。
2.有些需要的文字在一幅图的极小部分，截图OCR效率更高。
3.浏览器中限制复制的文本在网址前面加了read://可以复制了。
4.应用程序中的文本，使用软件GetWindowText或者Textify获取到文本，部分不能获取到文本的只能截图OCR,和第二种一样的解决办法

第一种情况，拖拽到目标程序OCR体验过以下几个：
ABBYY FineReader OCR 16：自动识别，质量非常好，对照编辑，识别速度很慢。
Foxit PDF Editor 2024：一步识别、质量很好，无对照编辑、识别速度一般
gImageReader 3.4：一步识别、质量一般，对照编辑、识别速度一般。
PDFelement 10：一步识别、质量很好，无对照编辑、识别速度一般。
PDF-XChange Editor 10：一步识别、质量很好，无对照编辑、识别速度一般。
**Readiris 17：一步识别，质量很差，对照编辑，识别速度很慢。
Text-Grab 4.4：自动识别，质量一般，无对照编辑，识别速度一般。

其他不支持拖拽到程序图标的，需要在识别前打开程序窗口，或者从托盘程序图标菜单中找命令，交互明显慢些，识别速度稍微快点（因为程序在内存中了），这类程序的全局快捷键有时在冲突问题就。

第二种情况，截图后文字识别体验过以下几个：
ABBYY Screenshot Reader 16：后台二步识别，质量非常好，对照编辑，识别速度很慢。
Ashampoo Snap16.0.2：后台三步识别，目前中文识别有问题，对照屏幕编辑，识别速度一般。
Captain2Text 4.6.3：后台热键交互特别，质量一般，无对照编辑、识别速度一般。
eSearch 1.11.0：后台一步自动识别，质量很好，无对照编辑、识别速度慢。
HyperSnap 9.4：二步识别，目前识别有问题，无对照编辑、识别速度一般。
PDFelement CaptureTool 10：一步识别，质量非常好，对照屏幕编辑，识别速度很慢。
PixPin 1.8.0：后台二步识别，质量很好，无对照编辑、识别速度快。
pot 2.7.9：后台二步识别，质量很好，对照编辑、识别速度快。
QQScreenShotNT Plus 2.1：后台二步识别，质量很好，对照编辑、识别速度快。
Screenpresso 2.1.23.0：三步识别，质量一般，无对照编辑、识别速度一般。
ShareX 16.0.1：后台一步识别，质量一般，无对照编辑、识别速度快。
Snipping_OCR 1.3：后台二步热键识别，质量很好，对照编辑、识别速度很快。
SnippingTool ：热键三步识别，质量一般，无对照编辑、识别速度很快。
STranslate 1.0.8.313：后台二步识别，质量很好，对照编辑、识别速度快。
TechSmith Snagit 2024：后台二步识别，不支持中文，编辑窗口、识别速度慢。
Text-Grab 4.4：一步识别，质量一般，无对照编辑、识别速度快。
Umi-OCR 2.1.0：后台二步识别，质量很好，对照编辑、识别速度快。
YoudaoDict：二步识别，质量很好，对照翻译编辑、识别速度快。

以下是可通过截图后自动发送到OCR程序的：

Ashampoo Snap16.0.2：三步发送，截图体验好。
FastStone Capture 10.4：二步发送，滚动截图优秀。
MiniCap 1.40.0.1：命令行一键发送，截图体验一般。
PicPick 7.2.8：三步发送，滚动截图优秀。
Screenpresso 2.1.23.0：三步截图发送，截图方式很优秀。
Screenshot Captor 4.43.0：命令行一键发送，截图体验一般，功能强大。
Snipaste 2.x：命令行一键发送并用记事本打开文本，无对照编辑，截图体验一般
SPX Instant Screen Capture 7.0：二步发送，截图方式很优秀。
WinSnap 6.1.2：三步发送，截图体验一般。

以上各有优缺点特点，我发的求助实际是求推荐两个小工具：

第一个求的是直接拖动到程序图标可快速高质量自动OCR的程序。
第二个求的是串起个性化工作流的辅助工具。
下面第一步是截图体验很好很快，第二步是OCR速度质量都很好，最后一步要同时显示图像文本文件并且文本可编辑。
Screenpresso.exe capture --action ScreenshotRegion --filepath "G:\output.png" --quit

FineReader\FineCmd.exe G:\output.png /lang ChinesePRC English /out %userprofile%\Desktop\result.txt /quit

并排显示G:\output.png 和%userprofile%\Desktop\result.txt

cngych · 2024 年4 月 9 日 04:34

目前Screenpresso一步无后台的截图OCR方案：
写个ps1用Ps1ToExe转成隐形控制台exe。Ps1内容：

.\Screenpresso.exe capture --action ScreenshotRegion --filepath .\Medias\output.png --quit | Wait-Process
支持处理命令行导入的图像OCR程序名称.exe .\Medias\output.png

上面的最后一行可参考的内容：
 Tesseract-OCR引擎 ..\gImageReader\bin\gimagereader-qt5.exe .\Medias\output.png

 PaddleOCR引擎 ..\Snipping_OCR\Snipping_OCR.exe .\Medias\output.png

 ABBYY引擎 ..\ABBYY FineReader\finereaderocr.exe .\Medias\output.png

Snipping_OCR 1.3.5 新增了支持处理命令行导入的图像功能，还有capture参数启动直接一步使用系统截图工具截图OCR。

话题		回复	浏览量
如何获取软件内显示的文字/ 有没有好用的免费外语ocr的网站问题求助❓ windows	0	750	2021 年4 月 15 日
大家的天若OCR最近能用吗？问题求助❓ windows	14	1622	2022 年9 月 2 日
天若OCR文字识别专业版本发现频道 🔎 appinned , windows	12	24153	2020 年2 月 21 日
一个Excel表让普通人实现批量OCR、批量生成报表、批量发送微信等一万种操作发现频道 🔎 windows	5	2601	2022 年4 月 17 日
截图翻译(OCR)--随时随地翻译屏幕发现频道 🔎	5	1855	2020 年4 月 3 日

求个能命令行导入图像后OCR并排显示的工具

相关话题