Pdf文件乱码

今天整理了一下文件,发现有几个PDF文件乱码了,情况如下:
1.文件内容中发生乱码的全为中文字;
2.文件名有部分乱码;
3.文件是Squid导出生成的

示例文件如下:example.zip - 蓝奏云

请问如何复原原本的内容?:tired_face:

起码就示例文件而言: 信息丢失太多, 基本无法还原.

除非示例文件就就一个字"转".

1 Like

软件 PDF-XChange-Editor ,Comment → Flatten

把 PDF 中的注释展平,可有效减少乱码发生。

1 Like

这个我不太懂…请问阁下的意思是Squid的笔记是以注释的方式来生成的么? :innocent:

难过:pensive:
我还存有好几个这样的文件,其中有一部分是知道乱码的字是啥的,那么这部分文件能否复原呢?(这里就不放示例文件了,因为这部分文件都是账号密码:confounded:)

同时我还发现一个问题:有些在电脑上创建的Word文档通过USB线传到手机时,手机上看文件名会乱码,请问这种现象应该如何解释呢? :disappointed_relieved:

可编辑的非英文注释,常出现乱码。

没有用过 Squid,但用过 Goodnotes,在导出 PDF 时,默认的格式是可编辑,可以选择展平。

1 Like

文字编码问题, 通常是因为 Android 系统默认采用 UTF-8 编码.

pdf乱码一般2个原因:

  1. 中文字体缺失导致------修改pdf的中文字体或者安装对应的中文字体.
  2. 某些软件对中文支持存在问题导致. ----- 没辙.
1 Like

pdf中文乱码主要原因是字体没有嵌入
你可以用对中文支持较好的福昕阅读器来查看,有部分乱码pdf中文会正确呈现
如果还不行,可以用 PDF 补丁丁 嵌入或替换的缺失字体,中文应该就不会乱码了(不过这种办法因为你替换的字体和原缺失字体字距、行距都不同,有可能部分文字会叠在一起)
最后可能还有极少数还会乱码,那就放弃吧,要处理的话太麻烦,时间和精力都要太多,完全是得不偿失

1 Like

很抱歉,回复晚了 :sob:

PDF补丁丁中识别出来的原文档的字体为Roboto-Regular,我安装了该字体.下图是没有该字体的PDF阅读器打开的结果:
before
下图是安装了字体之后用word打开的结果:


emm…好像系统把第一个字识别出来了之后就用第一个字替换了文档中所有的中文字.我不理解,但大受震撼 :disappointed_relieved:

用了3.0的福昕阅读器,发现不能识别 :confounded:

试着用了一下替换字体这个功能.我将文档中的字体替换为了微软雅黑,结果:1.二十个文档里大部分结果相同,还是乱码;2.少部分文档在替换之后,文档里的一两个中文字被成功识别,但是位置不对了…忘记截图了,如果有需要可以再复现一遍操作…

现在我把Squid卸载了,因为感觉不是那么好用…我模糊的记忆里并没有这些选项…当然也可能是我记错了 :thinking:

或许新的福昕阅读器能识别,但这个测试我留到有空的时间再来了…

属于这种情况

1 Like

没注意到你给得有示例文件,我下载看了下,这种PDF你还是直接放弃吧
这种都不属于中文乱码的范畴。这个符号是个文字占位符,完全是软件生成PDF时就丢弃了中文,将中文文字全部替换为文字占位符,等于PDF里已经没有任何中文文字的信息了,没办法还原的

1 Like

好吧 :face_with_spiral_eyes:,最后一个问题:

遇到这种问题时有啥解决办法嘞?

感谢解答 :rose:
有一点疑惑:在上面我提到了

这种情况是不是说明文件里的中文字没有被替换干净呢?

不用otg, 用ftp模式远程访问手机, 编码可以设为utf-8, 这样就不乱码了.

1 Like

请教一下,展平相当于变成不可编辑的,比如图片吗?

乱码是缺少嵌入字体,在保存 PDF 后,再 flatten 一遍,那这个 PDF 在其他电脑的 PDF 软件中就能下常渲染了。在使用 Squid 导出时,设置导出选项,展平注释,应该能解决。

或者

for example, when you create a PDF, a copy of each font used is added into the PDF file itself. This is also known as embedding fonts. When the PDF is opened on any computer, all the fonts will be there the way you intended. In other file formats, the fonts are not embedded, meaning that if another computer does not have the fonts you used, it will not be able to find the fonts and will replace them with one they have. Other formats, such as DOC or DOCX, will apply styles and formatting based on the source and version of Word used to view the file. With a PDF, what you see is what you will get in your final printed product.

Once you have saved your final design file as a PDF, you want to make sure you flatten it before you submit it to your printer.

找出 PDF 缺少的字体并解决(未测试):

https://pkuwwt.github.io/techniques/2014-04-07-repair-pdf-font-embedding-problem/

不知道,但是展平后,就不是多个有级别的图层了,可能就只剩下一层了。

If you print your PDF as is, you will only print the layer that is visible onscreen as opposed to all visual elements from various layers. To avoid this issue, you want to flatten your PDF file for print. Flattening a PDF for print removes transparency information and converts images to a format that the printer can read.

Pro tip: Save a working version of your file as well as a PDF version that you can flatten.

Whether you are ordering color copies, business cards, brochure, or booklet printing, you will need to submit a flattened PDF.

1 Like

右键复制粘贴到记事本,显示的文字是转。所以原先文件里是不是转?如果是,可以尝试修复。如果不是,就别折腾了

1 Like