shadows
(shadows)
1
前言:最近下了些扫描杂志,从正版平台扒的,但清晰度属实堪忧,论坛里也有介绍过用老马的ComicEnhancerPro做处理,但是调参数属实有些费眼睛和手,于是搜索到了这个。
使用 Real-ESRGAN和纯文字/彩图训练集 针对性地训练了一个超分模型,应用在扫描书籍上效果明显。
个人使用体验:
修复前:

修复后:

优点:
傻瓜式优化,无需设置
缺点:
略微费时,超分后体积显著变大(210KB → 1.9M),但可以使用无损压缩工具再缩减体积(还是这个图片,用压缩图片 压缩后是390KB)
另外求一下处理此类扫描图书简单易行的方法和软件
5 个赞
yazii
(Yazii!)
3
emmm 这玩意是我做的来着。Real-ESRGAN这个项目本身就强,也得益于nihui大佬把他弄成ncnn版后window、Linux、Mac都能直接跑起来,这才让超分爆火。
其实如果显卡比较好,更好的方式是魔改一个pdf阅读器,只对pdf预处理几页,这一就不会造成文件体积爆炸了。但是显卡好这个假设过于离谱,毕竟我自己都靠嫖显卡过活,根本不值得动手。
但是好电脑没有,有好手机的人还是比较多的,也在考虑魔改哪个支持扫描重排的手机pdf阅读器……
据我所知,之前已经有人给r18漫画阅读器加了超分插件了
3 个赞
shadows
(shadows)
4
手机处理能力这么强了吗?
我觉得只处理图片的话,不需要很好的显卡,我核显都不算费时(1340*1024的也就10s),稍微更好点的显卡,用于pdf预处理就已经完全足够了
yazii
(Yazii!)
5
8gen2处理1080*945图片需要20秒,但是如果用高通的sdk加速只需要3秒。虽然我发现效果也有劣化就是了。但是这个速度可以实用化了。
更新的两代芯片只会更快
如果是自己扫的,根本用不到这些东西, 600ppi甚至300ppi就相当清晰了, 黑白文字/画面的话, 无损压成png再做PDF, 体积也不大. 有灰图/彩图的时候才需要有损压缩
自己扫书, 扫描仪+Xnview+PDFill就够了, 书签用老马的PdgCntEditor, OCR用Acrobat或者ABBYY
蠢就蠢在: 有些书明明是黑白的文字, 有些人却要压成jpg, 糊得一p, 看着眼睛就累
超星罪大恶极
1 个赞
Baiyssy
(Baiyssy)
7
我觉得这个问题还是OCR出来比较好吧,然后再找个模型校对一遍。
J.q
(riverainbow)
8
试试这个开源软件,Scan Tailor experimental ,软件安装包不到10m,纯算法处理,处理过是tif文件(猜测是矢量化了),一张才40-50k,还可以多页处理,扭曲矫正。
楼主推荐的可以类比是dlss,我这个软件可以类比是taa fxaa。
这个软件历史比较长了,2007年开发的,就是因为开源的,期间换了几个维护者,所以直到上周还在更新版本。
shadows
(shadows)
9
这种图文都有的,我还是更喜欢原貌的排版。OCR后的校对也不比跑模型轻松
前言已经提到了老马的ComicEnhancerPro,差不多类型。主要问题是新手很难调到这样的效果…
Baiyssy
(Baiyssy)
10
图文排版太复杂的可能是比较麻烦,不知道号称很强的Mistral OCR行不行
毕竟文本的版本才能重排版、复制、查询、AI处理等等。
3_5105
11
夸克的转word能实现较好的混排,不知道效果能不能达到要求,也不知道用的是不是开源模型
下来试试.
前一段时间为了给孩子的试卷清晰化, 找了一堆效果都不好.
yazii
(Yazii!)
13
应该是不行的,毕竟用途不同。模型是针对扫描书这个实际场景,模拟生成了数据集并进行训练的,与拍照的场景差异很大.
反过来讲,有针对拍照做优化的模型吗?大厂有的,多年以前三星就已经有通过超分辨率技术实现更清晰的数码变焦了,但是至少我没有看到过能实用化的开源模型.
针对你的具体应用,我知道有个收费软件据说效果很好,但是毕竟我分享开源他闭源卖授权 我又没有这种刚需,很难再多说好话 图片魔法师软件是专业的批量图像处理工具,2024年11月发布v1.20.250.109,支持图像批量漂白、PDF一键漂白、彩色漂白、批量转换、批量打印。支持图像裁剪、裁边、换色、去噪,OCR表格、去水印、去手写、去竖线、透视校正、歪斜校正、卷曲校正(可选)。支持自由排版、身份证一键拼版。 - Charltsing - 博客园