针对搜索引擎进行白名单过滤,插件 uBlacklist, 搜索引擎 cse.google.com

我推广下白名单,而不是黑名单,黑名单是无限的。白名单可以是有限的,对解决 bug 来说,真正的能搜到的且有价值的不过 100 个, 以有限的精力去维护有限的白名单,这种过滤工具总是有的,白名单却很少变化。对于一个新的工具,如果规则不同,那就写个脚本对名单重新整理下即可。

只要是支持自定义过滤搜索结果的搜索引擎,都是不错的选择。

uBlacklist 目前支持搜索引擎有 Google, Bing, DuckDuckgo, Ecosia, Startpage, Qwant

  • 就访问速度上看,Bing 最快。

  • 就样式上看,Bing 最好

    • 在使用油猴本 AC-重定向 将搜索结果多列显示时,Bing 的样式要比 Google 好看,Google 显得有些乱。
    • Bing 页面最底端没有相关搜索(几乎用不到,还占位置),也没有搜索关键词对应的相关图片。

原理:

先添加规则 *://*/* 以屏蔽所有网址。

对于白名单,这样添加: @:*//*.前缀.域名.后缀/*,如 @:*//*.github.com/, 区分大小写

对网站进行分类,然后统一生成符合 uBlacklist 规则的白名单。

只获取网站下的博客部分,和问答交流部分,通过前后缀做区分。

最后生成的名单可以汇总到 whitelists_combined.txt 中。

uBlacklist 7.0 支持对订阅规则的开关功能,所以可以定阅不同类别的白名单,然后根据搜索需要只开启一部分。

注:白名单会使得每一搜索页中的内容变得特别少,因为符合白名单的网站,可能不在结果的第一页,
因此,要在设置中,把每页搜索结果数调得尽可能大。

浏览器插件 uAutoPagerize 支持在自动翻页的同时过滤搜索结果。

这在一定程度上实现了书签的功能。如软件下载站,如果有人持续保持对这个列表进行更新,那就不需要去搜集和收藏这些网站了。

Blacklist 一直都在用。不过要从根本上解决这种问题,还是需要搜索引擎自己对这类垃圾进行过滤,单靠第三方工作量太大和效率太低。从目前来看,Google中文搜索基本是放任没人管的状态,各种内容农场把搜索结果污染的乱七八糟,cn.Bing 相对好点。而英文搜索结果几乎很少出现垃圾内容。

Google 在 06 年就推出了 google 可编程搜索(白名单搜索)。cse.google.com

白名单搜索的需求肯定是在 06 年之前就有了的。不知道为什么,没人推广。

我已经将整理的域名 https://github.com/bcaso/Google-Chinese-Results-Whitelist/blob/main/whitelists/domain_name.txt

添加至:https://cse.google.com/cse?cx=e9a1e480e37a86080&q=

已经可以用来代替默认的搜索引擎了。

搜索质量还不错。

1 Like

我觉得这个想法很赞!

那还有图片什么的,你用开源的searx不是更好吗

我没在设置中开启。

我一般都认为我搜索结果中的图片没必要出来,如 google 中的与关键词相关的 “相关图片”,“相关搜索词”,没必要显示。

比如你要搜索图片的时候,你不要说你从不搜索图片,那当我没说。

你站点是设置了,但是我要横向对比内容怎么办呢?我需要在图片结果,sns结果切换,你怎么办?

白名单搜索本身就意味者“不全面”,切换下搜索引擎就可以了。

但是我不能因此去修改白名单的内容。

你最好就别说,每次有人解决了 A 问题,你就追着问为啥没能解决 B 问题。

为什么不带帽子呢???

这个不是全面的问题,因为现在的多媒体本来就是这样,google也会显示图片和影片的结果,哪怕你只搜索网页,更不要说我要横向对比多个搜索引擎,或者混合多个同类搜索结果。

白名单站点是一种办法,但是上限太低。

其实google,微软等大公司失败的项目也很多,不好用没什么奇怪的。