求问:怎么给 pdf 添加 可跳转的目录?
WPS 和 Adobe Acrobat 都可以的,不过是手动操作。
还有就是用这个,也是手工制作,不过挺方便的:
另外,对于有些 PDF 文档,Adobe Acrobat 是可以自动识别并添加目录的,好像是叫 “根据结构自动添加书签”,太久不用我有点忘了,有需要的话您可以试试。
这个软件
是这个吗?
恕我冒昧,介绍软件好歹给个官网链接啊……
看了一下,也就是 pdf 添加目录都得自己手动打目录,然后才能生成链接,这貌似工作量略大
极个别文档是可以用 Adobe Acrobat 识别出目录的(不过那种文档似乎本来就是用 Word 做的、里面保留了一点 Word 的标题信息),其他的的确很难,网上给的方法大多也是先找到文字版目录,然后通过一些自动化工具去文档里面识别。
我目前是手头上有一些点校本二十四史修订本的pdf,但没有目录,网上貌似也没找到现成的。所以就感觉自己来的话工作量略大了些。以下是其中一个pdf
这……恐怕真的没办法了。甚至我担心,找自动化方法的时间,或许都和自己上手干的时间一样长。
所以当时我搜索过,后来直接放弃了 毕竟这不是一个pdf文件,而是有好多个
另外,最近将《三国志》直接打印出来慢慢看,pdf就搁置不管了,纸质版翻起来还是比较容易的。
顺带吐槽一下,这种书籍想支持正版都难……自己打印花的钱其实不比买书便宜,但是正版书是32开的,字太小了我感觉眼睛要废,自己打印直接用A4纸,16开的看起来字体大小就还算勉强能接受。
如果是纯文本,并且有“第一章”或者之类的字样,或许可以先用工具利用正则表达式拿到所有章节开头所在页码的列表以减轻工作量
他那个文档我看了,有个很大的坑是:文档中虽然有可复制的文本,但都是竖排的,可能还需要进行一下 “转置”。
找了一通,发现没有电子版…
但是好在目录还有标页码,而且是完美的横平竖直。可以精确定位每一章的页码的汉字所在的格子。针对汉字〇到九的图像识别要求不算高,自动化应该可以完成
写完了才发现,楼主问的有可能是点击PDF页面进行跳转,而非点击书签。姑且提供一种思路吧。
如果是只要求跳转到所在页面,而不要求具体坐标的话,可尝试PDFPatcher(作者博客 PDF补丁丁 - 博客园 ,GitHub GitHub - wmjordan/PDFPatcher: PDF补丁丁——PDF工具箱,可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档,探查文档结构,提取图片、转成图片等等 )。
这是我目前尝试过的方法中,性价比最高的一种。
- 从京东或者淘宝等其他网站的商品介绍页面获取书籍的目录(包括章节标题(含章节编号)及所在页码)。
- 将标题及页码导入excel中,对页码进行适当处理,将页码统一加上正文第一页之前的页数(一般包括封面、书名页、版权页、目录页),以使目录能正确跳转到实际页数。
- 将处理好的标题及页码粘贴到PDFPatcher中的书签部分。如有需要,可手动添加封面、书名页等。通过PDFPatcher的“快速选择书签”功能,对章节标题进行级别设置。
- 保存PDF。在弹出的窗口中选择“页码标签”选项卡,点“添加”,对页码样式进行设置,其中“文档页码”是指从PDF文档中实际第几页开始。我一般添加三项,一是目录页之前的所有页面(封面、书名页、版权页等)页码设置为大写英文字母,二是目录页设置为大写罗马字母,三是正文设置为阿拉伯数字。其他设置可保持默认,或按需设置。选择输出路径,保存即可。
- 打开PDF,输入页码尝试跳转。输入正文的最后几页,验证PDF文档的页码标签和书籍本身的页码能否对应得上。有的作者在扫描制作PDF文档时,会删除空白页面,造成PDF页码标签与书籍本身的页码出现偏差。可通过二分法查找缺失的页面,手动插入空白页面补齐页数即可。
就是这个