在kindle上阅读k2pdfopt重排过的PDF电子书

首发在本人博客

在研究了一上午如何给Kindle刷机无果后,我放弃了在Kinlde上使用KOReader的打算。转而研究怎么在电脑上先处理PDF后发送给Kindle看。这个时候我发现了k2pdfopt。

官网地址

这玩意的原理是不经过OCR,而是大致判断每个字占用多少面积大小,像拼拼图一样把每个字作为一个图案来打乱重拼。

这个软件的win版是有GUI的,而且我在书伴网站的介绍帖子底下找到了有人发汉化版。那有汉化必不用英文(bushi

先裁边

k2pdfopt理论上也是可以自动裁边的,但是那个裁边效果不好,看到有字就不裁,把页眉页脚也给放进来了。当然这么搞也不影响阅读,只是觉得难看,效果不好。

于是用PDF编辑器来手动裁,我用的软件是ABBYY FineReader,这个切边比较方便。

这里在切边的时候可以分奇数偶数,这对于扫描出版物而言是个很实用的功能,因为扫描书扫出来往往都是左边那一页偏左一点,右边那一页偏右一点。当然一般的书遇到这种情况,那截得胖一点也没什么,大不了左右留点空白,反正等下重排的时候也会去掉的。但是有时候会遇到那种页码标在侧面的书,或者有些翻译书会在侧面标原书页码,这个时候又不想把数字也截进去,不然重排之后好端端一行字里面突然蹦个数字出来,那就得活用这个区分奇数偶数来切边的功能。

当然还有那种做出来就是在网上分发的文字版PDF电子书,那种理论上可以直接用ABBYY的功能另存为epub,不过我没试过,也不知道效果如何。

重排

重排就是用k2pdfopt,win下不用操作命令行,不怎么麻烦。

右上角的设备是要调过的,我的kindle型号是KT2,选项里虽然没有,但是想来这台机子比较垃圾,在这里找分辨率最低的 kindle1-5 估计也差不离。

这里默认打开的智能断行(smart line breaks)应该关掉,这个功能是给英文用的,防止一个单词太长被劈成两半写进两行里。因为中文不用担心一个冲字被拆到第一行一个冫在行末,第二行开头半个中字,所以这个没必要开。甚至万一开了,他会按照英文的分词逻辑,把两个标点中间没带空格的中文全部视作一个单词,这个情况下生成的文章立马变成诗歌……

智能断行后面的输入框是字间距,中文的话越小越好,比如我这里是0.001。稍微大点,生成的PDF里字间距就会乱七八糟一会小一会大。

自适应(Autostaighten)则是能在PDF扫描歪了的时候(常有的,一个PDF拿来一看是斜着的)能做点微调,把看起来像是斜着的字给掰正了。

我这里还在附加参数那里输入了-m,这个参数的意思是先智能裁边,然后再进行重排。这个智能裁边,就如我前面所说的,不会裁掉页眉页脚,所以并不是那么好用。如果前面已经先用别的软件裁过一次了,那这里不需要这个参数了。

参数设置完之后直接Convert All Files就成。

压缩

其实到这一步之后这个PDF就已经可用了,拷贝进Kindle里面已经可以看了。就是重排出来的PDF体积巨大,原来这个布哈林的《共产主义ABC》有14M,重排完变成了36M了。

嫌重排出来的文件体积太大可以再去找那种在线压缩PDF的工具,或者本地压缩的话ABBYY也行,不过要我说,这一步搞不搞没啥差别了,照样用。

最后拿来压泡面

看到这个重排效果这么好,我和满书架还没看的书还有steam游戏都笑了。

4 Likes

koreader 好像有重排选项?没用过,电纸书那个性能大概是不能指望吧。

因为手贱把kpw2越狱弄没了后就对kindle死心了,买了kobo libra用的很爽。

另外我个人基本屯书的时候会绕着扫描版pdf走,基本会尽量选epub。

主要好多书只能找到pdf

想肯定是想找epub的……

主要是因为我看书没有啥目的性,有epub、看起来合眼缘的先看,所以目前扫描pdf排不上号。

爱了爱了,这东西是好东西。果然官网越丑,东西越靠谱(

@yuukoamamiya 你的博客似乎是挂了(今天在 RSS 看到无法检索

1L那个地址是我原来的大号被github封了之后应急的,现在申诉出来了就把那个给注销了

现在新地址是这个

1 Like

这个 k2pdfopt 这么多年都不变样子的啊。

补充一句……
有一些PDF是一页一个书签的,在转换的过程中就会把每一页当作一章,直接换页



遇到这种PDF还得先把书签重新编辑一遍……