公司内网有个资料库,但是有些难用,就想着自己下载下来,建个本地的全文检索库。
需求:
- 持续监控网站页面变化,使用xpath之类语法的指定元素
- 自动下载新发布的pdf或网页内容
- Windows 运行,不需要安装复杂的数据库之类的服务
公司内网有个资料库,但是有些难用,就想着自己下载下来,建个本地的全文检索库。
需求:
网站监控的话,有个 Distill Web Monitor 的浏览器插件 Distill Web Monitor (google.com)
看到以后第一反应是合规吗(
huginn
看来是没有
如果不想连外网.
可以用 automa 这个自动化扩展.