想找:把网页中需要的部分采集下来,不是导出数据库而是导出网页,有点类似网页采集+为知笔记的结合体

感谢多次帮助,我开头提到为知笔记就是想能够尽量保持网页原来的格式,感觉通过emacs的组装不能达到目的。

感谢帮助,这款抓取我了解了下,发现导出数据库还行,但是如你这么说的操作就太麻烦了。

不妨试试 SingleFile 和 Print Edit WE(需要 PDF 虚拟打印机)

1 Like

是的zsbd

https://mika-cn.github.io/maoxian-web-clipper/index.html

我猜这个应该贴合楼主的需求

1 Like

@Dalieba @emdoe 请问下是否支持批量处理,还是需要一个个网页操作?SingleFile试了下只能单个处理

请问下该如何把语言设置成简中,我看配置中有,但是不知道该如何设置。

批量好像不行;要批量的话…说明是在一个网站上的多个页面?其实真的可以考虑自己写了…

哦,那些都只能一个个处理

是不是系统本身的语言就是英文的?
RTFM: 为知笔记 | 常见问题:如何修改语言? (wiz.cn)

没有啊,我主程序就是简中的,难道是和我的便携版有关?
将语言设置为繁中,插件依旧英文,再设置回简中,插件还是英文。

感觉你可以尝试一下我们才发布的WeBooK. 可以保存整个网页,也可以选取区块,或者链接进行保存,也可以打开多个网站选择要保存的内容。因为自带编辑器,保存之后可以编辑,可以导出pdf电子书,改名称,添加描述,设置封面啥的。图片的话大多数都能保存下来。
发布的原帖在这儿:保存、编辑、重组本地文件和网页, 生成电子书--WeBooK
不知道是不是你想要的那种哈,如果我理解有误就忽略我 :see_no_evil:

感谢告知,我看了下后端用的是wkhtmltopdf,也是我采用的程序,不过该程序存在一点问题。

不客气的哦!可以麻烦告诉我你遇到的是什么问题吗?
我们一直都在发现问题,优化程序呢。

wkhtmltopdf官方提供的程序,对Win7支持不好,对网页中的图片路径支持不好(需要file://),当然最终还是能转换出来。

请问为何没有推荐Save Page WE?

对于现在腐烂的互联网,一个个无法访问的链接就是最直观的体现。这篇长文也提及到这一点:The Rotting Internet Is a Collective Hallucination - The Atlantic

我想,离线网页的需求也许就是被这种情况逼出来的。

我个人推荐,或许可以考虑用 https://web.archive.org/ 或者是 https://archive.today/ 这种网页时光机去保存一份,最后把获取的链接存档到本地笔记之类的地方。

甚至如果有更多的需求还可以自己搭建可自托管的网页时光机 ArchiveBox

edge和chrome插件“简悦”差不多符合。

感谢回复,我现在是想把还存在的网页保存在本地,找批量的办法。网页时光机暂时不用,而自建推广感觉成本有点高。

简悦确实很强大,不过它不适用批量处理吧?