谷歌怎么那么喜欢索引抖音 zhuanti? 网页内容经常和网页标题无关 - -

有些网站故意给搜索引擎的索引喂一些垃圾食品,再通过一些手段拉高自身权重——就会导致搜索结果的垃圾泛滥:face_with_symbols_over_mouth:——这是主因。

次要原因是 Google 自身对中文搜索的要求不高,就是凑合能用的那么一个水平。

1 个赞

内容农场啊,抖音这个是毒瘤

2 个赞

一向如此:
https://www.huxiu.com/article/3087958.html

1 个赞

反了,应该是这些无良网站运营者利用搜索引擎算法的漏洞,大量铺洒自己的纯垃圾机器生成内容。

1. 内容农场的发展

  1. 早年的一般是机器采集内容,然后仿写复写文章、添加广告,文章标题形如 《S60 怎么刷机,S60 是什么,S60 手机安装系统破解教程》。例如这个网站软件:
  1. 然后有人发现:好像不需要这么麻烦,直接批量生成搜索关键词和站内搜索引擎页面就可以了!于是就出现了大量的 《Android 开发如何添加 Activity - X 站内专题》。点进去则只有若干条和标题毫不相关的、胡乱搜索的结果。这里的「X」仍十分猖獗,甚至国内大厂也拉下面子入场,我遇到过的就有华为云、腾讯云、阿里云、京东云、Bilibili、快手、抖音、知乎、CSDN、Gitee、开源中国……

  2. 小站点采集站也坐不住了,搞起了专长化。例如 VoidCC 这种专门采集 Stackoverflow 回答,再机翻成中文插入广告的小网站开始出现,继续霍霍各个领域不懂英文的人士。(后来,这一套也被腾讯云等大厂「引入」了。)

最近几年,Google 学聪明了,调整了算法屏蔽这些内容中的大部分。

现在随着大语言模型兴起,早在 2023 年初就有了利用 AI 批量生产垃圾内容的站点,我称为「下一代内容农场」。内容农场的目的只有两个:

  1. 无下限地利用任何手段铺设页面,钻算法漏洞占领所有搜索引擎的前排,以及
  2. 利用点击量赚钱

2. 应对内容农场

算法的调整需要时间,而语言生成技术不断发展。各大搜索引擎需要不断调整算法应对。例如,我上个月在百度和 Google 中搜索「彩漂剂和洗衣液可混合使用吗」时,前 20 页没有任何有效内容,全部是由 AI 和其他机器生成的垃圾网站中回答得牛头不对马嘴的答案。今天我再尝试搜索时,结果已经正常很多了。

对个人,我的建议是利用网站黑名单。我目前使用这个插件来屏蔽页面中所有内容农场链接:

https://danny0838.github.io/content-farm-terminator/zh/

不过作者不是大陆人,所以默认内置的名单可能不包含一些国内的内容农场,可以去 GitHub 上搜索相关屏蔽网站名单来补充。

3 个赞

好东西,用了,之前就想要一个类似的工具,但随着使用,已经达到见内容农场,自动略过的境界,故没下心思去找,结果今天碰到了,那就果断用上

抖音在推送内容方面已经有了很雄厚的技术积累吧