有什么软件工具,能够制定规则抓取一些网页内容,然后制作成chm格式文件。
使用场景是买了网上一些源码授权,开发文档是绑定授权账号查看的,不方便团队开发。想把开发文档的网页保存为chm。页数不少,手工就麻烦,想找工具。
原本想找chm的工具,后来被人提醒批量保存网页内容并集合生成一个本地离线的电子书或者文档的方案(类似chm) - #4,来自 qinshou
似乎chm是IE内核,已经完全不适合这个时代了。所以找类似的格式方案。
有什么软件工具,能够制定规则抓取一些网页内容,然后制作成chm格式文件。
使用场景是买了网上一些源码授权,开发文档是绑定授权账号查看的,不方便团队开发。想把开发文档的网页保存为chm。页数不少,手工就麻烦,想找工具。
原本想找chm的工具,后来被人提醒批量保存网页内容并集合生成一个本地离线的电子书或者文档的方案(类似chm) - #4,来自 qinshou
似乎chm是IE内核,已经完全不适合这个时代了。所以找类似的格式方案。
为知笔记?
SingleFile 倒是支持把网页存成一个单独的html文件
伪静态还好,但新架构的html页面,chm这种ie内核可能都加载不了。
单页我也用。但是页数太多就工作量大。。。
好像也是,忘了这个古老格式是IE内核时代的东西。
现在有什么类似的格式做这种离线文档电子书的。求推荐
文字图片类的文章,格式化网页的,地址有规律的,我一般用Calibre2的ebook-convert.exe
可以自己用python写简单的爬取逻辑,直接导出为epub。
同求,有结果了吗?
还没有呢
首先你要下得来网页, 批量保存网页可看看Cyotek WebCopy.
然后生成电子书的话, Calibre(通过自带的ebook-convert.exe)与Sigil都可从html生成epub.