w568w
(w568w)
1
最近有几本书的 PDF 扫描件,希望能做成 EPUB 电子书。我目前设想的工作流是这样的:
- 用 MinerU 将扫描件识别为 Markdown 格式文档;
- 手动复制粘贴,对照原书修正格式错误;
- 导出为 EPUB。
但不清楚用什么工具比较好?我的需求是:
- 能编排目录结构、作者、封面这些元信息;
- 尽量简单易用,有一些预制的主题和文本格式。不太想手写 XHTML;
- 需要支持修改内容、支持图文混排;
- 输出的 EPUB 兼容性强,能在不同大小屏幕的设备上阅读(尤其是 Kindle 这类电纸书)。
或者各位如果有手工制作 EPUB 的经验愿意分享,那就更好了。
我自己之前尝试过 Calibre,但感觉它的主要功能是修改已有的 EPUB,对创建新的 EPUB 不太方便。目前正在尝试 LibreOffice Writer。
扫描件用 MinerU 识别为 Markdown 的效果已经算相对好的了,然后你需要手动对标题级别、错别字等进行修复。
之后我是把 md 文件和图片都拖进 Obsidian,图片路径替换为绝对路径,再用 Pandoc 插件导出为 docx,这样能保留目录、标题级别、图片等。
我刚刚试了试将导出的 docx 用 calibre 转换为 epub 格式,目录、图片都是正常的,但是表格没有边框,除非你在 docx 中给表格加上边框。

我又试了 Obsidian Pandoc 插件直接导出为 epub。

1 个赞
qinshou
(秦寿)
8
可以用重排来解决,虽然美观度上不足,清晰度还可以,比如多看就有这个功能
tiger
(小虎王)
9
我只用过 Sigil 它的编辑器界面就是很常用的,特别适合新手。
1 个赞
@qinshou 你是指扫描版PDF直接发到手机上,手机APP来进行重排?多看就能做到?
@tiger 但是Sigil的功能太专业了,相比之下Calibre对新手更友好。
qinshou
(秦寿)
11
是的,扫描版直接放大字号,就能实现重排,下图是一个扫描版图书的效果,原先的页数20也被重排到了中间,并不算影响阅读吧。Screenshot 2025 10 16 14 25 20 608 com.duokan.rea - ImgLoc
1 个赞
w568w
(w568w)
12
实在不好意思,诸位。我在几个站都提了相同的问题,忘记到这边来回复了。
你可能没理解我的问题。我正是在问 「docx 转成 EPUB 和精修」的过程,用什么工具比较好。
还是差挺多的。放到 Kindle 之类的设备上,几乎不能读了。
嗯,我也知道可以重排,但我想排的书是这样的「图文混排」:

试了下 KOReader 和 pdfopt,效果都不是特别好。不过简单规整的文本书籍,确实可以直接用重排来读。
不知道对于图片很多的书,Sigil 处理起来方不方便?我也安装体验了一下,感觉功能好像是 Calibre 的子集?
感谢分享!我在 V2EX 上收到的回答和你的类似,目前是按这一套思路来操作:
- 导出成 docx,保留图片
- 用 LibreOffice Writer 一章一章地修正
- 用 Calibre 直接导入 docx,转换成 epub
- 在 Calibre 里添加目录和元信息,继续对照原书修正
1 个赞
不知道原版文字是否清晰,没有对比无法下结论,但是就重排来说效果还可以。
不过就如前面提到的,如果是图文混排就比较麻烦了。