求一款网站更新监控和资料抓取软件

公司内网有个资料库,但是有些难用,就想着自己下载下来,建个本地的全文检索库。

需求:

  • 持续监控网站页面变化,使用xpath之类语法的指定元素
  • 自动下载新发布的pdf或网页内容
  • Windows 运行,不需要安装复杂的数据库之类的服务

网站监控的话,有个 Distill Web Monitor 的浏览器插件 Distill Web Monitor (google.com)

看到以后第一反应是合规吗(

1 个赞

huginn

1 个赞

看来是没有

如果不想连外网.

可以用 automa 这个自动化扩展.