有没有能把中文扫描pdf 直接ocr转epub的软件?

win10,,,,,,

步骤应该是这样:
Adobe Acrobat(OCR)→ Calibre(转 ePub)

直接pdf转ocr有,但是要输出成epub比较麻烦,主要问题是章节区分和排版。

ABBYY 也许可以,退一步讲它也可以直接输出docx,后面用 pandoc 还是 Calibre 啥的就无所谓了

不过多数 OCR 还是没希望直接转成带章节保留格式的成品的,上 AI 应该也希望不大(考虑到正确率)

1 个赞

其实,微信读书可以。

2 个赞

也就是说扫描版的PDF,在微信读书里看起来就和正常电子书差不多?

对,可以选,正常电子书或者原貌

我还以为是文本重排, 居然真识别文本, 还能ai问书, 一步到位, 正愁一堆PDF找不到epub

导入微信读书的pdf可以导出epub吗?或者能导出微信读书自己的书吗?

能指示一下这个功能的位置吗?我最近也有这个需求,尝试了一下微信读书的网页版和 Android 客户端,均没有找到相关选项。

唯一有关的是 Android 端有一个「切换电子书格式」的按钮,但点击后提示「正在切换」,几分钟后则提示「无法切换到电子书」。

不行,应该是只能在微信读书里看。

你问问楼上看看,我好久没用这个功能了,具体位置不太深刻了。

谢谢,一天没登录微信读书,今天打开突然发现已经转换好了……

似乎是导入之后不需要做什么操作,会自动加入服务器后台序列开始索引,但这个索引没有进度,如果是比较厚的书需要的时间可能就比较长。

不过比较可惜,生成的书籍没法导出为 epub。

我现在在探索别的方案了,见新帖:有什么比较好的制作 EPUB 的工具?

pdf-craft

1 个赞

以前见过这种工具,不知道对pdf转换出来的epub能不能下载

最后更新在3年前的还能用吗?
下载的epub完全自由的?
如果两个都是肯定的,我倒是愿意去付费了。

其实单论文本,LLMOCR的效果不错,但如果是要考虑图片和排版,就比较麻烦了。

不知道了,可以先试试呗,我只是偶然看到过,但是也没用过 XD