Windows 下的《全文搜索工具》

这里将提名 Windows 下的一些全文搜索工具,主要针对各类文档,比如 Word、PDF、文本文件、电子书等。

各位可以在提名前投票。

4 个赞

还有一个好像叫filelocator的

AnyTXT

一个桌面搜索工具,有着强大的全文搜索引擎,是 Google Desktop 的搜索替代品。支持 Windows 10, 8, 7, Vista, XP, 2008, 2012, 2016 系统。

官网:https://anytxt.net/
介绍:AnyTXT Searcher - Windows 10 下的全文搜索工具 - 小众软件
授权:免费

1 个赞
  • @52tuao内容查找工具 查找文本 必须装WPS
  • filelocatorpro@downloadly全文正则搜索,比如文件名只包含四个中文的图片和只含三个字母的图片或者组合
  • Archivarius 3000 付费全文搜索可预览
  • docfetcher中文差
  • textseek
  • bbdoc支持压缩包网页PDF
  • 开源全文检索解决方案:Meilisearch 搭建方便API友好自带后台界面 可汉字同义词错别字
  • textlocator@GITEEliulei901112占用不高性能好支持压缩包全文搜索各种文档
  • tantivy全文搜索基于rust性能好?7.3kstar
1 个赞

Textseek,everything content关键字,docfetcher,anytxt,百度硬盘搜索,还有个antr…3000,都用过,最后还是觉得filelocator最好用,体验、稳定性方面都最好,所以买了pro

1 个赞

dnGrep

我提名一个dnGrep吧,完全开源免费,搜索稍慢但是比较准确,支持大部分格式的全文搜索,还支持使用命令行
dnGrep/dnGrep: Graphical GREP tool for Windows — dnGrep/dnGrep:适用于 Windows 的图形 GREP 工具 (github.com)

TextLocator

TextLocator 是一款 Windows 全文搜索工具,可以检索 Word、Excel、PPT、PDF、DOM、TXT、图片、压缩包、代码等文档。

官网:本地文本搜索定位器: 基于.net实现的本地文档的全文索引定位器,根据关键词搜索定位本地文档内容。便于查找历史文档时节省时间,本地文本搜索神器!
介绍:TextLocator - 卖萌的小老头:低 CPU 占用的本地文档全文搜索工具[Win] - 小众软件
讨论:一个全文搜索软件TextLocator
授权:免费

既然提到了txt,那就说个纯文本的全文搜索工具ripgrep吧。

文本全文检索软件中,recoll索引文件最大,用户体验最好,但RECOLL的windows版本必须捐赠才能使用,非常不方便,如果有大神把RECOLL移植过来
索引文件借鉴RECOLL,会产生一个伟大的
Desktop full-text search tool

everything

PowerGREP

一个桌面搜索工具,有着强大的全文搜索引擎,能搜索文本文件、二进制文件、压缩文件、Office 文档(微软 Office/OpenOffice)、PDF 等。支持使用正则表达式搜索和替换

官网:https://www.powergrep.com/
介绍:⸺
授权:付费

1 个赞

OpenSearcher

OpenSearcher 是一款开源的全文搜索工具,支持常见 Office 文档、PDF、.TXT,以及 ePub 和 Mobi 电子书。@Appinn

官网:GitHub - Gaoyongxian666/OpenSearcher: 一个基于PyQT5开源的、本地的、安全的、支持全文检索的搜索器。
介绍:OpenSearcher - 开源的全文搜索工具:支持 Word、PPT、PDF,以及电子书 ePub、Mobi 等格式[Windows] - 小众软件
发现:OpenSearcher 开源的全文检索工具
授权:开源

AnyTXT Searcher 1.2.483 文件夹名有半角逗号会报错
DocFetcher 1.1.11 需安装 Java Runtime
TextLocator 2.1.31.0 小屏幕电脑UI超出了边界
TextSeek 2.18.3700 综合来说还可以,目前在用
FileLocator Pro 据说很强尚未测试
其他的话,还听闻过BBdoc、dnGrep和TommSearch 也还没测试

现在有定论了吗?工作原因需要搜索doc、excel、ppt、pdf、txt等文件的内容,可以平时等待索引,但是希望索引能够同步,也就是说索引和文档库可以用同步软件同步,平时的索引用台式机搞定。

如果你像我一样,已经放弃了 docx,pdf 等二进制文件,只想搜索纯文本,可以使用 ripgrep(就是 vscode 内置的搜索工具,只要装了 vscode 就能用)

用vscode打开文件夹,左边搜索栏可以搜索所有文件内的关键字

Sea Desktop Search (有付费版,但大多数功能免费也可以用):

它能:
搜索文件名、文档内容、图片OCR、压缩包、扫描版 PDF、NAS 网络磁盘

这个工具的一些方面是真的强,举例:

  1. OCR 支持扫描版 PDF 而且识别率很好(实测拿了一个百兆的扫描版 PDF,全部 OCR 识别了)
  2. 支持压缩包搜索:压缩包内文件名、压缩包内文件内容、压缩包套娃(就是压缩包内套压缩包)
  3. 支持 NAS/SMB 网络共享磁盘搜索(而且支持有密码的网络共享)
  4. 支持的文档类型很全,除了常见的 Office,还支持 XMind、WPS 等
  5. 支持逻辑搜索,可以自己组合出并且、或者这样的搜索条件

不仅如此,他的模糊搜索准确性非常好(文件名搜索和文档内容搜索都是),还专门针对文件名/路径搜索优化过。

举例

实战 VS Everything 路径搜索之模糊搜索

Everything 由于文件夹名不是完全匹配,因此没有结果

如图,是不是很智能?

实战 VS Everything 路径搜索之分词搜索

Everything 由于文件夹名不是完全匹配,不会分词,因此没有结果

如图,Sea Desktop Search 把路径层级作为整体进行搜索,给出了最佳匹配

实战 VS Everything 路径搜索之容错搜索

Everything 由于存在文件名中没有的文字,因此没有结果

Sea Desktop Search 这个模糊搜索太好了,是资料多的人的福音!

实战 VS Everything 路径搜索之搜索结果相似度对比1

Everything 的结果相似度不如归海

Sea Desktop Search 排序结果比 Everything 更合理

实战 VS Everything 路径搜索之搜索结果相似度对比2

Everything 只给出一条符合的,其余的由于跨越了多个层级,Everything 没能显示出来,于是把下面的子文件显示了出来。

  • 搜索work\product时,将所有路径层级包含 workproduct 的文显示出来才最合理,work最好是上一层(也可以是上N层),product 必须是最后(可以是文件夹也可以是文件)。

Sea Desktop Search 将最匹配的放在第一条,次之的放后续

支持 OCR 图片 / 扫描版 PDF 文字内容识别搜索

  • 支持 OCR 图片文字内容识别搜索

支持 NAS 网络共享磁盘搜索

NAS / SMB 网络共享磁盘也可以添加进去和本地文件一起搜索

可以 Docker 部署局域网 Web 在线搜索服务

如图,通过浏览器访问搜索引擎

有需要的百度搜:Sea Desktop Search 下载就可以了。

TextSeek

http://www.likasoft.com/cn/index.shtml

MG Search in Contents

仅仅通过任意给定文本就能高速搜索各种格式的文件及其内容,包括 Office 文档、PDF、纯文本、编程文件、网页等,自带文件查看器

官网:Search in Contents - MSTECH GLOBAL
介绍:⸺
授权:付费