有没有给PDF的OCR软件

MoYuLao · 2023 年1 月 7 日 05:02

2023.01.08更新：
我没说明清楚。我得需求是有个pdf文件，但是可能里面都是图片，搜不了文字。
比如我附图的，是供应商提供的pdf（好几个JG连接器厂商手册都是这样），当我要找寻某个型号，不仅没有书签，那就得一页一页看慢慢翻，就比较麻烦。
底下那个软件“ocrmypdf”可以将pdf在OCR试别后加一层文字层，就变成可以搜索的，而且我看体积也有减小，很方便了。
今天下午有时间折腾了下，发现已经解决了问题。就是软件版本在ubuntu清华院内的tesserat版本是4.0，但github上最新版本已经是5.3了，更新了版本就解决了这个问题。附图也是测试效果，很不错。@小青蛙可以推荐。

----以下原文—
发现这个软件，但自己使用发现不是很准确。处理后对不上文字内容。

它使用 Tesseract OCR 引擎，将 PDF 的内容识别成文本，然后给 PDF 文件增加 OCR 文本层。从而实现可搜索和复制 PDF 的内容，已支持 100 多种语言。
(GitHub - ocrmypdf/OCRmyPDF: OCRmyPDF adds an OCR text layer to scanned PDF files, allowing them to be searched)

gsdg · 2023 年1 月 7 日 07:25

要么就是acrobat自带的ocr识别，要么就是QQ的截图识别啊，基本够用了吧

MoYuLao · 2023 年1 月 7 日 08:17

不是，他是能覆盖个文本层。就把只是图片得变成可以搜索了。

kli2018 · 2023 年1 月 7 日 10:16

可以试试PDF-XChange Editor带的ocr,用的ABBYY的引擎,423有盗版,中文翻译库可能要挂代理

ZDavy · 2023 年1 月 7 日 11:37

用wps吧，质量不错，不过要会员

nick-tru · 2023 年1 月 8 日 06:40

SwifDoo PDF，支持多语言OCR，简体中文识别准确率挺高的，虽然是收费功能，但时不时有会员半年限免，可以不断累加，目前羊毛已经攒到26年6月。

mnvacd · 2023 年1 月 8 日 08:33

福昕高级PDF编辑器是支持的，如果所在企业或者高校买了直接用就好，个人买可能不太划算。

shugen002 · 2023 年1 月 8 日 10:26

冷知识，onenote也有一定的ocr能力。

AdminAppinn · 2023 年1 月 9 日 14:48

“一定的”
我觉得你还是委婉了

vuszjbg · 2023 年1 月 17 日 03:34

Acrobat 就可以识别呀，还有最强的 ABBY，这个是专业处理文档和OCR程序。有破解版

jack_w · 2023 年1 月 19 日 07:53

对比过acrobat和abbyy，abbyy识别准确性和排版更好（只指文字层），但是如果要导出word、excel的话acrobat吊打abbyy。
还有就是不知道是不是我操作方法不对，abbyy我只能单个文档识别，不像acrobat可以多个文档批量识别。

话题		回复	浏览量
截图/扫描PDF用OCR软件问题求助 ocr	1	644	2022 年11 月 20 日
[求助] 2026年Windows系统OCR软件选型求助讨论问题求助 windows	16	1047	2025 年12 月 15 日
桌面 OCR 应用我最喜爱 linux , windows , ocr	8	3954	2023 年2 月 22 日
寻求高准确率OCR软件问题求助 windows	24	704	2026 年2 月 28 日
[Win] 求一款支持『横排竖排』的『本地』『日文』 OCR 软件问题求助 windows , ocr , 日文	25	1362	2025 年3 月 30 日

有没有给PDF的OCR软件

相关话题