寻求高准确率OCR软件

由于工作需要,需要经常性的识别图片中的文字。几年下来后,用过Quick的,Umi-OCR的,还有好多不记得名字的。发现还是微信的截图识别文字在不那么清晰的时候,效果还是相对较好的。

可是,微信的截图然后选择识别文字还是要点2次鼠标,而且还要在弹窗选择复制文字,在经常使用的情况下,我嫌麻烦。

也尝试过一些单独提取微信截图的小软件,不知道什么原因都未能正常使用。

不知道大家有什么推荐不?
需求:
1、可以快捷键截图;
2、可以截图后直接识别并复制文字;
3、尽量小巧;准确性持平微信,或者更准确就太好了。或者说有能用的提取版本也行。

感谢!

有不少软件支持调用微信的识别吧, 比如STranslate, 可以配置OCR, 不翻译单纯提取文字;

智能 OCR
内置微信 OCR 引擎,无需联网即可
精准识别;

可以设置

OCR
用于调用OCR窗口进行文本识别的快捷键。

而且不嫌弃麻烦, 也可以用多模态大模型, 有不少对话类工具都能调用

1 个赞


pixpin: 支持直接复制文字。

小旺AI 截图:点击ocr按键,可弹出消息框,可以直接复制。


PixWit:支持截图界面时,点击识别文字,会弹出文字选择对话框,供选择后复制。


豆包:点击提取文字,可弹出消息框,可以直接复制。

这些软件都行。

1 个赞

微软 PowerToys 文本提取(系统级官方工具,零成本稳定无坑)

  • 核心匹配度:

    • 微软官方免费开源,和 Windows 系统深度适配,永不会失效、无捆绑、无广告

    • 操作:默认快捷键 Win+Shift+T 唤起截图 OCR,可一键设置「识别后自动复制到剪贴板」,2026 新版 AI 升级后,模糊图片、加密文档的识别准确率实测超过微信、QQ 截图 OCR

    • 轻量可控:可仅开启文本提取功能,关闭其他无用模块,离线识别无需联网,系统级权限可识别各类防复制的加密文本

  • 适合人群:不想装第三方小众工具,追求极致稳定、零学习成本的用户

1 个赞

弱弱的推荐一下微信的截图,配合截图快捷键,可以省一次鼠标点击

而且跟你现在用的软件使用习惯很接近,识别效果也跟你现在使用的软件相当

适用于 Umi-OCR 文字识别工具 的 WeChatOCR 插件

本来想着使用Umi-OCR 的微信插件方案是最方便的,结果试完才发现插件太久没更新,已经不支持4.0版本以上的微信了。

估计是公司电脑CPU太古老,并未能正常识别。

好像说了什么,又好像没说什么。 :joy:

谢谢推荐,POWER TOYS就不用了,刚卸载,太臃肿了。

艾比?

我这插件内置的可以用呀,填路径调用已安装微信4.0的OCR确实不行,格式变了。

其实内置的那个应该够用吧,企业微信里面还是用的插件同款模型呢。

1,你的标题太草率了,太误导

2,截图后ocr的软件,这个话题也太大,太多人不会问问题啊

3,这个话题问ai,如gemini或grox就很好

4,若是“ 在Windows10电脑上,找一个截图后ocr,且截图内容为中文简体或中英文混合,文字为主,少量的表格”

有2个工具很好,

1, faststone capture–有试用版也有特别版 ,

2,pixpin–开源软件,

不知道为啥,我使用STranslate微信引擎,鼠标转几圈之后就没啥反应了。

感谢一下子给推荐了这么多,我也逐个试用了:
pixpin:多功能的截图工具,识别率还是比微信差一丢丢。还是需要截图之后,再按按钮或者快捷键识别成文字;
小旺AI 截图:这个较早前试过,印象中识别准确率还是可以的,我当时应该是因为识别时间较长,所以没继续使用来着;
PixWit:待试用;
豆包:我可能对豆包有偏见;待试用;
感谢!

对喔,这问题丢给ai问一下也是个好办法。谢谢你

我给大家测试一个图片:

主要是后面毛重这个位置,没办法正常识别,即使是放大再识别。除非是逐行识别,这样准确率才会高一点。大家可以试试效果

图片

@patpat 3个需求对应表格如下:

需求 FastStone Capture Umi-OCR
快捷键截图 可设置 不支持
直接复制 默认未开启,可设置 默认未开启,可设置
体积小巧 约30MB 约440MB

PS:FastStone Capture的OCR调用的是系统接口,所以应该Windows11表现要比Windows10好。

@Messi 请问有没有WeChatOCR独立版?就是不依赖微信,不作为插件,可以直接当OCR软件用。

FastStone Capture 竟然意外的好用,识别效果竟然比微信还好。如果可以识别文字后,自动复制到剪贴板(这个功能有),然后不显示文字窗口(这个没找到设置的地方)。这样就完美了。速度快,体积小,识别准确。

我设置的是 Ctrl+4, 会直接复制成文字.勾选下次直接复制文本选项后, 没有弹窗.

像楼上的这个复杂图片, 我是用的豆包实现的, 不要选"复制文本", 要选截图提问→问问豆包, 然后让他整理成表格. 放大后截图提问的效果如下:

货物运输详情汇总表

集装箱号/封条号/唛头(CNTR. NOS./SEAL NOS./MARK & NUMBERS) 申报数量(QUANTITY FOR CUSTOMS DECLARATION ONLY) 危险品标识(HM) 货物描述(DESCRIPTION OF GOODS) 毛重(GROSS WEIGHT) 体积(MEASUREMENT)
OOCU0507207 / 0887949 / / 1 BULK /FCL/FCL /20GP 17357.340 KGS /
OOLU0112055 / 0887953 / / 1 BULK /FCL/FCL /20GP 17317.300 KGS /
OOLU0241601 / 0887951 / / 1 BULK /FCL/FCL /20GP 17717.700 KGS /
OOLU0773878 / 0887954 / / 1 BULK /FCL/FCL /20GP 17437.420 KGS /
TLLU3096445 / 0887950 / / 1 BULK /FCL/FCL /20GP 17497.480 KGS /
UETU2508179 / 0887952 / / 1 BULK /FCL/FCL /20GP 17477.460 KGS /
合计(BULKS) 6 / 6 FCL X 20’ CONTAINERS;货物为:MARLEX HIGH DENSITY POLYETHYLENE RESIN(HHM 5502BN BULK);原产国:沙特阿拉伯(SAUDI ARABIA);运费预付(FREIGHT PREPAID) 104804.700 KGS 162.000 CBM

补充重量信息

重量类型 重量数值
总毛重 104804.7 KG
总净重 104700.0 KG

精确识别,我觉得越要精确越要支持在线,例如调用千问模型、豆包模型等等,我做过测试,某些软件自称既支持在线,又支持离线下载模型识别,然后我就把在线离线的,各种近段时间大家公认的比较好的OCR模型进行测试,对比了包括Umi-OCR、pixpin、等等不同软件,还有一些支持把模型下载下来的一些网友自制的OCR程序,结果发现只要模型转为本地,识别能力就会大大下降。FastStone Capture 截图能力在不同的系统表现不一样,特别是中文~,另外 Snow Shot 就像是Pixpin的简版,我有时候拿来识别某一行文字,表现对有的很好,有的长数字,特别是0比较多的时候莫名缺少,原因未知!