【自荐】RawWeb.org 面向独立网站的搜索引擎

我很喜欢逛个人网站,尤其是博客。虽然可能加载缓慢、设计糟糕,但它们是某个人投入情感创造的、真正的数字花园,它们让互联网丰富多彩。

主流搜索引擎被社交媒体、商业 SEO 内容垄断了头部搜索结果,大量创作者转向私域创作平台,埋在独立博客头上的黄沙似乎越来越厚了。我太年轻了,没能经历互联网的黄金年代,但直觉告诉我这种趋势是不对的。

所以我搭建了 RawWeb.org 搜索引擎:

  • 只接受独立网站,通过 RSS 收录内容
  • 根据语言和相关性排序,目前没有其他算法
  • 对中、英、西、德、法、俄、日等语言做了分词优化
  • 支持 ""- 等基础搜索语法

欢迎提交推荐数据源。

挂掉了吗?Failed to request server.

已恢复

可以增加一个按语言筛选搜索结果的功能吗?或者在建立索引时,可否先按照语言对内容来源进行一下分类?否则搜索结果经常是好多种语言的文章混在一起,用起来很不方便。

是按照语言做分词的,也有仅搜索特定语言。在搜索结果页,输入框的下面可以选择语言。

那个我看到了,不过选了语言后搜索内容没有任何变化。

选择语言后不会自动触发搜索,要手动再搜一次。我晚上优化一下。

1 Like

还有一个问题:我搜索一个关键词,然后设置语言为 “中文”,接下来再按一次搜索按钮,新搜索结果的第一页就全是中文内容了,可第二页及以后还是有其他语言的内容。

另外,可否把语言选择作为一个全局设置,让用户在搜索前就可以选择想看哪种语言的结果,以后每次搜索默认只检索这种语言?

此外,可否考虑把语言选项作为搜索 URL 中的一个参数呢,像 Google 的可编程搜索那样,这样,只要配置好参数,就可以通过 URL 的方式直接调用您的搜索引擎。

1 Like

感谢建议。

  1. 可否提供一下搜索词。可能是语言识别的问题。
  2. 好建议,晚上一并优化。
  3. 搜索词、语言都在 URL 中,比如中文是 lang=zh 关键词是 q=linux。打开浏览器设置,搜索“搜索引擎”,然后向下翻应该能看到 RawWeb,可以直接启用。手动添加的话,“查询字符串”是 https://rawweb.org/?q=%s

好的,谢谢。

我刚刚使用的关键词是 VMware

1 Like

Hi, 问题都已解决。

  1. 某一搜索出现其他语言是匹配逻辑问题,已修复。
  2. 用户选择语言后自动触发搜索,选择的语言被记忆在本地缓存中。不过还是只在搜索结果页显示语言选择,因为放在主页有点突兀,以后有时间再优化,可能会单独做个 DuckDuckGo 一样的“设置”页面。
1 Like