对pdf文件ocr时,如何保留原文件的矢量元素,避免被转换成图片?

,

有一类PDF文件是通过生成混乱的内嵌字体来加密文件,还有一些pdf是把文字矢量化,无法搜索。上述这两类文件仍然是矢量的,放大不会模糊失真。
但在用abbyy和acrobat对pdf进行ocr时,会把这些矢量元素转换成图片,造成文件体积暴涨,而且显示效果也下降,所以请问有没有保留矢量元素的方法?

1 个赞

终结, :rofl:abbyy只点击recognize就行……

记得自己标个已经解决的记号哇

啥意思啊,没听懂,你用的什么软件进行ocr的 :innocent:

用的abbyy finereader