Calibre将扫描图片版的pdf转化为epub/mobi/azw3格式时,会把白底黑字的pdf变成黑底白字,不太利于阅读,有没有什么好办法?

如题,用calibre转Pdf时,遇到的问题,不论pdf引擎选什么(calibre or pdf2html)转出来的电子书每一页的图片都是反色的。
有没有什么处理的办法?

pdf 编辑软件编辑下 pdf 留两页保存个新文件发出来我试下。

epub应该可以自己直接定义css吧,直接修改css的滤镜,或者说默认滤镜可能给设成了反色。

1 个赞

憋转了,扫描pdf转epub何意味?反色不说,还有可能比原pdf还大
z-lib上发这种epub都是立马被骂出屎的

2 个赞

你都说是扫描图片版了 图片提取重新做epub不是更好

1 个赞

因为我用calibre的kindle邮件发送功能,不支持pdf的直接发送,而必须转成epub格式才能发送,发现了calibre书籍转换的这个问题,想修复下.

我没有每一页的图片,pdf是下载来的扫描版pdf

1 个赞

你要不试试kindle用来转漫画的KCC

github.com/ciromattia/kcc

1 个赞
  1. MinerU 等软件将 PDF 转换为 Markdown 文件。
  2. 完善 Markdown 头部信息,将文件中的图片链接从相对路径批量替换为绝对路径。
    ---
    title: "书名"
    author: "作者名"
    lang: zh-CN
    toc: true
    ---
    ……
    一、适有奔马践死一犬;
    ![](/home/duanluan/Downloads/images/xxx.jpg)
    ……
    
  3. Pandoc 将 Markdown 文件转换为 EPUB 格式。
    pandoc full.md -o output.epub
    
  4. Calibre编辑书籍,添加目录、样式、排版等。

经我测试,不存在这个问题。

环境 calibre 6.10
pdf文件: 纯图片,白底
epub文件: 纯图片,无反色。

如果写一个 Calibre 插件是有可能将上述流程自动化的 @HaoWine

您好,可以试一下这个pdf,看是不是pdf的问题。
我的是calibre 8.14

下载了新版本看了一下(发现自己的版本才是五点几,好多年没升级了吧),没有出现楼主所说的问题,你不如把转换完的epub发出来,我严重怀疑是默认的css设置问题。(总不会是阅读器的设置问题吧)

我研究了一下 这个文件以及转换后的epub.

calibre将该 pdf 转为epub时, 会将封面转为jpg, 内容转为 png 格式.

这就导致了封面是白底黑字, 而内容是黑底白字.

经多个软件转换测试发现:

1 很可能是pdf文件本身就是用png格式转换为pdf的.
2 叠加了格式转换软件自身算法问题

这2个问题一起导致了问题出现.

通过修改 epub的 stylesheet.css文件

.calibre2 {
  height: auto;
  width: auto;
}

更改为

.calibre2 {
  height: auto;
  width: auto;
  filter: invert(1);
}

使用css反色可以实现白底黑色.

1 个赞

谢谢您

您下载的新版calibre,可以正常转换上述临时文件里的pdf吗?好奇怪呀.小恐龙说的加一句css应该可以。

你用的肯定是扫描版的pdf,里面是图片那种,如果是文字,应该是没问题的。