Ai能否拯救rss?

试了下这么个流程,是可以跑通的,效果也不错:

  1. Zen 浏览器扩展:用另一个人的账号登录 Zen 浏览器,扩展后台定时抓取账号的关注动态
  2. 本地聚合服务:Node.js 服务接收并去重存储视频数据(内存中,关闭即清空)
  3. 油猴脚本:在 B 站首页的 Bilibili-Gate 中注入独立的「小号」Tab,展示小号关注的视频

效果如图:

然后zen浏览器我设置了开机自启且自动隐藏到右下角,几乎可说是无感使用。
如果愿意的话,现在有了ai,自己本地信息流维护成本应该不高,我还尝试了这么几个路子:将动态整合到大号动态流/根据up主列表来轮番爬取/生成rss链接并本地订阅。都可以较好完成任务。
相比其他平台的内容也可以按照这个方式简单获取,只是b站恰好有这么个脚本可以搭配使用,而且还有现成的api,有的网站可能需要完整加载html然后特征提取,那后台占用的资源可能就会很大了。
至于众包rss,更大的问题是需要拉人需要维护社区。



知乎b站本地生成的xml文件给其他软件订阅,目前运行良好

RSS好像没啥用,支持RSS的网站我不怎么使用,常用的几个网站全都不支持

所以,ChangeDetection配合自己写的规则,每小时自己爬一次,然后通过WebHook发给我的Discord服务器


之前以为有些内容必须html生成后再爬取(实际上豆瓣timeline就是如此),现在不需要浏览器直接nodejs爬,很安心。

RSS 动态订阅生成器

定时抓取 B站 / 知乎 / 豆瓣关注动态 → 生成 RSS → 上传 Cloudflare R2,配合 Inoreader 等阅读器使用。

纯 Node.js,无需数据库。一个 .env 搞定所有配置。

功能一览

模块 说明
:television: B站主号 抓取关注列表的全部动态(视频、图文、文章、转发等)
:television: B站小号 独立 SESSDATA,只抓视频动态
:speech_balloon: 知乎 关注列表的回答、文章、想法(自动过滤广告/推广/无效链接)
:open_book: 豆瓣 采用类似 RSSHub 的串行抓取策略,绕过风控,拉取并合并关注者的个人广播
:cloud: R2 上传 RSS XML 自动同步到 Cloudflare R2
:counterclockwise_arrows_button: 定时抓取 可配置间隔(默认 30 分钟),控制台显示时间戳
:magnifying_glass_tilted_left: 智能翻页 发现重复后可多爬 N 页,捕捉延迟出现的内容(B站/知乎)
:prohibited: 内容过滤 按动态类型、关键词精细过滤
:framed_picture: 图片代理 所有图片统一走 wsrv.nl 代理,避免 RSS 阅读器防盗链问题
:broom: HTML 清理 知乎、豆瓣内容自动 sanitize,保留格式标签,剔除无用属性
:bullseye: 小号 Tab 油猴脚本在 Bilibili-Gate 中注入独立「小号」Tab,点击 UP 主名可跳转动态页

GitHub - minsight-ai-info/AI-Search-Hub: One Query. All Search Skill. 聚合 Gemini、Grok、豆包、元宝等平台原生 AI 搜索能力,免费获取科技趋势、行业舆情、热点追踪、旅行规划、消费决策、日常问题统一接进自己的 Agent 与工作流,给一个链接就能直接爬取内容无忧操作直接使用 · GitHub 我觉得可以试下这个skill,你可以通过这个skill直接问个大平台的ai 帮我获取某个页面的信息,大厂自己的爬虫都已经做好了这些基本都能爬到