有一类PDF文件是通过生成混乱的内嵌字体来加密文件,还有一些pdf是把文字矢量化,无法搜索。上述这两类文件仍然是矢量的,放大不会模糊失真。
但在用abbyy和acrobat对pdf进行ocr时,会把这些矢量元素转换成图片,造成文件体积暴涨,而且显示效果也下降,所以请问有没有保留矢量元素的方法?
1 Like
终结, abbyy只点击recognize就行……
记得自己标个已经解决的记号哇
啥意思啊,没听懂,你用的什么软件进行ocr的
用的abbyy finereader