求推荐把带文件夹的html合并成一个html的工具(批量)

mhtml技術不是都會把需要下載的下載下来嗎?據我觀察,只要是當前頁面已經加載的,mhtml都會放進去。如果你在保存mhtml發現它有點慢,可能是因為圖片轉文本耗時。

但是mhtml只会下载明确引用过的资源…吧…
我之前也有遇到过,因为页面过度依赖动态加载,全部丢进js,甚至有的是根据状态来获取的不同信息,然后保存就翻车了的情况,当然这也比较极端…

1 个赞

pdf不僅會分頁,它還不能適配屏寬。並且,網頁轉的pdf似乎不會內嵌字體。

因此一般認為需要打印的話,pdf是最好的保存格式;但如果是閱讀的話,html應該是最好的。

你說的js動態加載的情況,就不符合「當前頁面已經加載」的條件。比如點擊某人頭像,才會加載此人信息,那你沒有點的話,mhtml就沒有了。

現在我覺的mhtml的一個用處是,保存維基百科以及維基教科書的一些內容。這些頁面打開之後基本都是靜態的。

(友情提示:如果大家以後要保存維基頁面,不要保存zh.wikibooks.org電腦端,而要保存zh.m.wikibooks.org手機端,因為手機端的頁面能適配屏寬。)

1 个赞

在文件夹里 copy *.html 1.html
就合并为1.html了

不是这种情况,是每个网页保存成一个html和一个文件夹的形式,需要把这两个合并。

1 个赞

@ejsoon 屏宽和字体忽略下也就算了,但是图片分成两页真的没法接受。
@CKylinMC 其实我不是要mhtml转html,而是想直接嵌入到html里,当然如果没办法通过mhtml也行。开发工具还是算了,感觉问题越来越复杂了。Python的工具你有推荐的吗?我不知道该如何去搜。

實際上,pdf的分頁應該是可以設置的,如果你把一頁的高度設的足夠高,那麼它就不會分頁。雖然我沒有試過。

我猜測你可能是需要iframe載入。

@ejsoon

PDF分页设置要靠软件实现吧?而且分页的PDF看起来也太奇怪了。

感觉和iframe没什么关系,有些含框架的网页也是把资源保存到文件夹中的。

确实越来越复杂了,因为打包成单html的方式确实不多,也许换个思维会更好一些。我去看了你之前提到的Save Page WE,其实在评论区就有人提到了保存单HTML的扩展解决方案。而且恰好前面 @amen 也提到了。

也许值得一试。

楼上有人推荐了哈,这个很好用,但我还没搞懂怎么保存多个标签页~

可以试试用火狐打开,然后用
图片
这个东西,直接就变成一页的了

@CKylinMC 感谢多次帮忙,Save Page WE和SingleFile我都测试过了,无法保存本地网页,在线的倒是可以,但是在线的多余网页元素占了一般以上,实在不行估计只能求mht或者pdf了。
PS:Save Page WE可以加载文件列表,这个很强大,然而依旧不支持本地网页 :sweat:
@puwei7788 情况如上所述,保存多个标签页可以用菜单中的Save unpinned tabs或者Save all tabs
@anon23138622 情况如第一段所述,我在Chrome中测试无法支持本地网页。

是的. 不过我们之前讨论的是 html .

跟mhtml不一样.

所以我才说 html包含很多附属文件.

另外据我所知, mhtml 也无法100%实现一些代码的效果. 不过对于阅读来说足够用了.

1 个赞

你指的是一个文件带一个文件夹的,还是集成到一个文件中去的?

确实如此,我测试了下edge保存的mht,火狐打开看不见图片,所以阅读够不够还得实操决定。

个人认为这种情况可以通过开启 Everything 的 HTTP 服务器这办法来绕开。
捕获
开了以后就可以通过访问这个服务器来打开那些保存的网页,这时候无论 Save Page WE 还是 SingleFile 都能搞定。

2 个赞

这个应该比较接近题意,但其实也依赖js

膜拜大神,这招确实可行,骗过扩展进行保存。
在有更好的直接转换工具出现之前,这个方案是最优解了。

最终还是要合并啊,我现在遇到同样的问题,你现在想到办法合并html了嘛???