求推荐把带文件夹的html合并成一个html的工具(批量)

Save Page WE扩展可以把网页所有内容放在一个html里,请问有没有类似的工具可以批量处理?
目前手头有一堆html和对应的文件夹,想把文件夹中的内容嵌入到对应的html中,最后就剩一堆html文件存档。

有个馊主意:Ctrl+S
image

虽然不是HTML而是MHTML…

不同网页有不同的设计,有的网页情况比较复杂,真的能够把不同网页完全合成到一个html里吗…

谢谢你的回复,让我明白了没说清楚,我是有一堆html文件,每个文件的附件都有一个文件夹,就是网页保存的样子,现在我想把这些文件夹中的文件,都嵌入到对应的html文件中去,剩下一堆html文件,不知这么说可有表达清楚?
PS:你的截图是哪个浏览器?

那你用浏览器重新打开一次不就好了(虽然有点麻烦)

意思是用一个HTML做导航文件呗?

昨天有看到,但怕理解错你的意思。没回复。

后来看到你对@ CKylinMC回复,发现我没有理解错意思。

image
一般存网页的时候,会有两个文件夹。

你是希望两个文件夹变成一个??(我昨天比较在意批量处理。)

上面网友回复的.ctrl+s保存的时候选择mht格式的,

就会只保存一个文件,其他附加文件就是你需求的直接嵌入到mht里面。

这就是一个很合适的解决方案了。

你如果用win系统的话。

把原本的html用ie浏览器打开。


后面在ctrl+s保存为mht就可以把原本html+文件夹=>mht一个文件夹了。

这点唯一麻烦的就是批量处理。

但这流程基本都是在本地就能操作的。有技术的话,自己写个程序,或者批处理。再不行录制一个宏。让他自动处理就ok了。

1 Like


http://cn.wizbrother.com/tools/html2mht.html

网文快捕家的(为知笔记).

我用的是Chrome,类似的Edge和其他Chromium-based浏览器也可以做到。

火狐还多一个导出纯文本,但是没有mht的直接导出
火狐还多一个导出纯文本,但是没有mht的直接导出

如果你是说每一个网页对应的自己的资源文件的话,mhtml可能确实就是比较好的解决方案了,具体方案和批量的软件上面的回答都提到了。

重新读了一下题发现其实是自己没理解到位反而干扰了其他人作答,在这里道歉…

1 Like

windows的帮助文件(chm文件)就是html格式的, , 可能满足你的要求

百度 生成chm

@junili 几百个文件手动不可能,技术没有 :joy:
@chr 不是,就是保存成一个个独立不依赖其他文件的网页文件

@user2333 @xiaokonglong @Niceb 最开始考虑的是mht格式但是感觉被支持得越来越少,目前只有微软家直接支持,所以想用html格式了。而chm更适合整合多个网页做电子书,暂不考虑。
另外如果是mht格式,除了为知,还找到Batch HTML to MHT Converter,是不是转换出来都差不多?

客气了,你的回答让我明白了提问有歧义,再次表示感谢。
想用html格式的理由上面已经提到,这里我发现了另外一个问题:
Chrome自带的保存成mht,重新打开会有问题(显示乱码),但是IE的不会。

PS:为什么你的Chrome保存对话框后面有括号显示后缀名,版本不同么?

之前有人推荐过 SingleFile 扩展保存网页
你打开全部已保存的,重新保存
它有这个功能
You can also process multiple tabs in one click and save:
the selected tabs,
the unpinned tabs,
all the tabs.

SingleFile - Microsoft Edge Addons

mht 和 mhtml 是同一个格式, 只是扩展名一个是缩写, 一个是全称.

@amen 感谢提供思路,这样的话一些网页保存扩展都可以用了。
@xiaokonglong 谢谢提醒,其实我是想用html格式,这个一定是最通用和不容易被淘汰的。

我个人比较建议用pdf. 首先单文件保存一定比多文件保存更安全可靠.

另外 html包含很多css,js这些附属文件, 有些链接是绝对路径, 有些是相对路径, 用户保存的时候很可能忽视这些情况, 导致有网和无网下, 显示效果不同.

甚至多年后才发现, 有些网址早就废弃, 导致内容其实缺少很多.

别问我怎么知道的. 网络时代初期, 我存了好多html格式的小说. :rofl: :rofl:

其实整合成PDF是我最初考虑的方案,也测试过,但它会分页。
这会导致一个问题,如果其中一张图片太长,就会被强行分割在两页,而网页格式就没这个问题。

我不确定,我记得我这里从一开始就带这些扩展名。有一个猜测,可能是因为我资源管理器常开显示后缀名的原因。

1 Like

另外,我看到有很多从mhtml转为单HTML的工具,python和node都有。我不确定是什么原理,但是如果是mht的问题而不是转换到mht就已经出现问题的话,可以试一下。

另外,如果能接受需要安装一些开发工具的话,隔壁可能有你要的答案:
https://segmentfault.com/q/1010000016715891