[求助] 2026年Windows系统OCR软件选型求助讨论
使用过一些OCR软件,能用但是不太满意,个人希望的软件特点如下:
- 小,准,支持AI大模型,只要OCR功能;
- 不要翻译功能,翻译全用AI客户端工具了;
- 每天OCR数量不多,用大模型接口足够,不需要本地OCR引擎;
各种遇到问题如下:
| 序号 |
软件名称 |
问题 |
备注 |
| 1 |
Umi-OCR_Paddle_v2 |
字符和换行经常不准,体积太大,AI插件不好用 |
|
| 2 |
STranslate |
AI大模型接口少,多了翻译多余功能 |
|
| 3 |
PandaOCR.Pro |
收费的,免费版用不了大模型AI接口 |
|
| 4 |
ScreenOCR |
小也准,但作者不再维护了,有时英文单词丢失空格连成一串 |
中文版叫识字精灵 |
有无一种OCR软件,具备如下特点:
- 大小:10-50 MB左右;
- 支持各种大模型AI接口;
- 不需要本地OCR引擎;
- 没有翻译、转语音等附加功能;
1 个赞
icue
3
感觉可以转换思路,从“找一款软件”变成“找一条工具链”。
比如,我能想到的应该可行的方案是:
- 用 ShareX 截图,它支持截图完毕以后执行各种自动化的动作
- 用胶水(Quicker,AHK等)把上一步和下一步自动连起来
- 用 URL Scheme 触发 Chatwise ,支持上传文件(图片)
Chatwise 我测试下来本地内存占用 15MB 左右,非常轻量,支持的 AI 接口也多。
这条链路应该满足你列的全部 1-4。Quicker 的动作库可能还能代替第一步。
1 个赞
lonel
6
ai视觉模型效果确实相比传统ocr好一些,但是一般没有持久的免费额度吧
POT 支持OCR 支持大模型OCR 但是同时也支持多语言翻译。 而且开源的。
不想用翻译可以只用OCR
1 个赞
使用过程中,多个文字识别成近似字形文字,精度不是非常高,无法和大模型比。
最多一天只识别少于30次,长期看可以充值很便宜,主要精度极高,且大模型不断进化,实时使用最新版。
Xclo
(Xclo)
16
他用的微信OcR的效果确实不错,不过题主明显想用的就是单单的OCR一个功能。
如果只是想简简单用OCR一个功能的话,我一嗯目前在用的是Quiker的一个动作。
鼠标中键呼出界面,选择功能,截屏,OCR识别。