要求:
1、能抓取所有浏览器能打开的页面所需部分,尽量保持主内容区版式不变,图片不损的本地化。本地化后有再排版编辑的能力。
2、本地化内容在预览时必须沿用web页面瀑布流式。文件能再次导入编辑软件中再编辑。
3、如果可能,尽量单文件,方便文件夹层级式的知识库归档。
经常会看到一些资料,比如
McFeely’s Wood Screw - Pilot Hole Drilling Size Chart
A guide to wood screw sizes - Screw size chart
现用Edge beta版,已经放弃保存为本地HTML了,会载入大量无用内容,自HTML 4.0 后,div+css的布局我已经不会用了。无法尽可能保持原板式的情况下做编辑。
换来换去,现在用 siyuan + Web Clipper 插件完成抓取(siyuan 自带的插件因为安装路径转移的问题,导致无法使用,且不弹出任何提示,软件方也不修复)。可编辑的问题解决了,但我不想依靠这类结构愚蠢的方式做文件归档。
导出PDF,网页被强制切割成A4真恶心。导出word,编辑+归档+单文件OK,查看起来和PDF一样恶心。
快2025年了,我还是没有找到一个好的解决方案。
非常感谢 要求:
1、能抓取所有浏览器能打开的页面所需部分,尽量保持主内容区版式不变,图片不损的本地化。本地化后有再排版编辑的能力。
2、本地化内容在预览时必须沿用web页面瀑布流式。文件能再次导入编辑软件中再编辑。
3、如果可能,尽量单文件,方便文件夹层级式的知识库归档。
经常会看到一些资料,比如
McFeely’s Wood Screw - Pilot Hole Drilling Size Chart
A guide to wood screw sizes - Screw size chart
现用Edge beta版,已经放弃保存为本地HTML了,会载入大量无用内容,自HTML 4.0 后,div+css的布局我已经不会用了。无法尽可能保持原板式的情况下做编辑。
换来换去,现在用 siyuan + Web Clipper 插件完成抓取(siyuan 自带的插件因为安装路径转移的问题,导致无法使用,且不弹出任何提示,软件方也不修复)。可编辑的问题解决了,但我不想依靠这类结构愚蠢的方式做文件归档。
导出PDF,网页被强制切割成A4真恶心。导出word,编辑+归档+单文件OK,查看起来和PDF一样恶心。
快2025年了,我还是没有找到一个好的解决方案。
非常感谢 Fendus 和 kat 这两位朋友。
仔细权衡研究了下,Zotero网页快照,这种保存资料的方式确实处于我的认知盲区,而且对网页的来源等有很好的溯源,支持中文,还有其它插件可加载。所以选择了他的答案。
其实二位提出的 Chrome扩展 Just-One-Page-PDF 还有 SingleFile ,其实也算是版本答案。基本平替掉了我现在使用的 siyuan 这个当时不用不行,用着流泪的软件。可选择性的快照页面并保存为单独的HTML文件,确实非常有利于资料的文件夹式归档。
唯独美中不足的是,table为框架的老HTML我还能编辑下,div+css的4.0及以上版本HTML,我看看就好,不想碰。我记忆中除了dreamweaver好像也没有什么像样的网页编辑软件了。但dw在进入cc前的体量就骇人,如今我至少也八年没用了。但日常归档也基本够用不需要细节编辑了。
非常感谢各位的支招!扩展了我解决问题的思路,介绍了很多好软件!