自荐 chinese-internet-is-dead 项目,这是一个网站黑名单列表,我已经维护 3 年了,能有效过滤垃圾网站
这个问题我研究过。结论如下:
- 所有搜索引擎都可能不及你的预期,除了本身有广告干扰,或者自身关键字缺乏技巧外,无良网站疯狂做SEO引流,给搜索引擎填充垃圾数据才是根本因素。
- google在中文索引收录上不及百度,这是客观事实,因为google的爬虫在国内有限制。
- bing在搜官网方面比其它一众要强一些,因为bing下限没那么低。
如果只用一个引擎,建议bing。
平时如果搜百科类比较多,建议AI对话,它的训练数据相对有保证。市场上流行的秘塔一类的靠从搜索引擎找数据再总结的,其实没有参考价值,源数据都不准,听它总结完也是浪费时间,不如自己老老实实查常规搜索。
如果要找资料,或者要找资源,还得同时看多个不同的索引引擎。这个浏览器插件应该能帮到你,它的聚合搜索特性能同时查多个搜索引擎,也能AI搜索
「效率集」聚合搜索 - Microsoft Edge Addons

edge据报设置百度搜索带推广链接
份额有下降吧?
那还不至于,至少在找官网上……
现在的Google怎么回事?虽然我也不抗拒用Bing,但用内版还是外版是个麻烦,因为可以直连,就懒得爬,但没有AI。
和Google比较呢?
建议手动搜百科网站吧?AI还会夹杂其他网站信息,反而更不准了。
google在国内索引受限,中文内容不比bing强。
我说的AI查百科,是百科类的东西,类似解释性的东西。AI的训练数据大多是严格筛选的,关键是AI可以多轮对话,比单纯关键字查效果更好,更容易缩小范围。尤其是多AI对照看,一般没有太大偏差。
闲了没事可以发到 发现频道
嘛
不知道怎么回事,可能谷歌懂中文的员工都从搜索部门调去别的岗位了,也可能原本分配给中文的服务器资源挪到别的用途了
我有个GitHub Pages上搭的博客,每次发新内容,必应基本都能在一周内收录,谷歌过半年都是已识别未抓取的状态
你指的是知乎等禁止爬虫?
文史类的内容,比如能够明确分辨答案正误的那种。我用AI查的结果质量参差不齐,完全看AI索引了哪些网页,感觉还不如自己用搜索引擎。
青蛙是看明白了咋用?
如果差那么多,真的必应要首选,谷歌备用了,你的必应测的是翻前的还是翻后的?
必应的爬虫不分地区吧,提交站点的后台就那么一个,翻前翻后应该只有用户端的排序和广告有区别吧?
不是,百度百科和知乎禁止谷歌和必应的爬虫。
翻前翻后我觉得一些内容上有差异吧,不然翻前也无法直接使用了。
禁止爬虫那是百度和知乎的问题了……现在谷歌中文的问题是想让他爬他也不爬
内容…不搜敏感话题应该没太大区别吧![]()
你可能对AI的工作原理不是特别熟悉。AI的数据并不是要去网页抓,网页抓的那是RAG配合的,RAG的内容,也就是从搜索引擎查了总结的那种信息,本身可靠性差,没有价值。我说的AI数据,是初期训练时采用的数据,一般是严格限制的,准确度高,权威性高的数据
内容…不搜敏感话题应该没太大区别吧
问题是对于同一内容的判定,用户、监管和服务商尺度都不一样……
我说的AI数据,是初期训练时采用的数据
比如说是GPT3.5那样不会联网的?
就是现在最新的chatGPT,默认数据也是不是联网获取的。联网那种是RAG,补充原训练数据不足的情况。
像秘塔这些调用搜索引擎数据总结果的所谓AI搜索,都只会是过渡。因为搜索引擎的数据,本身不可靠,用于新闻搜索没问题,用于名词解释,没有太大价值
因为搜索引擎的数据,本身不可靠,用于新闻搜索没问题,用于名词解释,没有太大价值
赞同,毕竟网上数据,有质量的少,那像国内的腾讯元宝和Kimi之类的,应该是算RAG吧?
怎么能稳定访问bing.com不被跳转,不想用cn开头的国际版
这事是我无法转向bing的首要问题
感谢邀请,已经发布到发现频道了 ![]()
KIMI可以关掉联网,就是用的它本地的训练数据。豆包,元宝以前可以关,现在不能关了。为了这个所谓AI变现,丢掉了理想,原则,去吃眼前过渡的RAG快餐,堕落了。
New-Bing-Anywhere扩展+海外IP就可以稳定访问了
感谢,可行
Kimi的关联网是通过和AI对话吗?我选项里没看到。