【求助】如何实现手写稿的OCR识别或提高手打速度

今天看到广大网友热情帮助解答

想让大家看看,我这种有没有好的办法,不求识别率有多高,只求能够提高文本识别的效率即可,现在只能是一张一张的完全人工识别。
试过几个OCR软件,完全无法识别。

原始图1

原始图2

如果是你个人的笔记,理论上得自己训练(改进)OCR模型吧(

提高速度的话,感觉直接双拼或者五笔打字

是我们这里当地名人的以前的笔记,识别难度太高。
我感觉应该也是要训练自己模型,但自己没玩过。
试着玩了一下,但连基础的软件都装不好。

这种字人类看起来都费劲,就更别指望机器了 :smiling_face_with_tear:

2 个赞

所以想着有没有好办法

嗯…如果有人可以完整熟练地认出每一个字的话,可以用语音输入,整个念一遍然后校对即可

:rofl: 这个我怎么感觉比那个日文的难度还要大

1 个赞

这也可以,核心工作感觉只能人工了

如果要求不大完整的校准,可以丢给AI检查语义错误;如果要求逐字的校准可能需要更优的技术手段或者人工处理

关键是一个字也识别不出来呀

对于这种难以辨识的手写字可能是最好的办法了 :laughing:

啊,我的意思是在语音输入完成之后的校准

这倒是个好主意。

看了一眼,似乎是文言,那语音输入也很难

别说OCR了,恐怕没接触过类似文字的普通人也难以识读。

应该是白话,但可能有点古早(第一页写的是 “民国十年”,也就是公元 1921 年),而且没有标点。

应该是毛笔写的,和现在通行的硬笔书法有一定差异,没学习过毛笔字的人读起来可能会有一定困难。

这个恐怕纯手打反而是最快的,除非手稿真的特别多。语音输入也比较麻烦,要先处理句读,但是字都认识了,为什么不找人直接打出来呢?

“上午十一点钟,就午饭毕。”

这种用语音输入很难准确

如果是同一人的笔迹,量特别大的话,训练一下模型性价比还是不错的。就怕是不同的笔迹,量又不多不少的,就没有特别好的方案。不是现代汉语的话,语音输入也会有很大识别问题。

如果有经费的话,可以试试请速录员录入。

1 个赞

我想试一下训练,但是不会