mhtml技術不是都會把需要下載的下載下来嗎?據我觀察,只要是當前頁面已經加載的,mhtml都會放進去。如果你在保存mhtml發現它有點慢,可能是因為圖片轉文本耗時。
但是mhtml只会下载明确引用过的资源…吧…
我之前也有遇到过,因为页面过度依赖动态加载,全部丢进js,甚至有的是根据状态来获取的不同信息,然后保存就翻车了的情况,当然这也比较极端…
pdf不僅會分頁,它還不能適配屏寬。並且,網頁轉的pdf似乎不會內嵌字體。
因此一般認為需要打印的話,pdf是最好的保存格式;但如果是閱讀的話,html應該是最好的。
你說的js動態加載的情況,就不符合「當前頁面已經加載」的條件。比如點擊某人頭像,才會加載此人信息,那你沒有點的話,mhtml就沒有了。
現在我覺的mhtml的一個用處是,保存維基百科以及維基教科書的一些內容。這些頁面打開之後基本都是靜態的。
(友情提示:如果大家以後要保存維基頁面,不要保存zh.wikibooks.org電腦端,而要保存zh.m.wikibooks.org手機端,因為手機端的頁面能適配屏寬。)
在文件夹里 copy *.html 1.html
就合并为1.html了
不是这种情况,是每个网页保存成一个html和一个文件夹的形式,需要把这两个合并。
@ejsoon 屏宽和字体忽略下也就算了,但是图片分成两页真的没法接受。
@CKylinMC 其实我不是要mhtml转html,而是想直接嵌入到html里,当然如果没办法通过mhtml也行。开发工具还是算了,感觉问题越来越复杂了。Python的工具你有推荐的吗?我不知道该如何去搜。
實際上,pdf的分頁應該是可以設置的,如果你把一頁的高度設的足夠高,那麼它就不會分頁。雖然我沒有試過。
我猜測你可能是需要iframe載入。
确实越来越复杂了,因为打包成单html的方式确实不多,也许换个思维会更好一些。我去看了你之前提到的Save Page WE,其实在评论区就有人提到了保存单HTML的扩展解决方案。而且恰好前面 @amen 也提到了。
也许值得一试。
可以试试用火狐打开,然后用
这个东西,直接就变成一页的了
@CKylinMC 感谢多次帮忙,Save Page WE和SingleFile我都测试过了,无法保存本地网页,在线的倒是可以,但是在线的多余网页元素占了一般以上,实在不行估计只能求mht或者pdf了。
PS:Save Page WE可以加载文件列表,这个很强大,然而依旧不支持本地网页
@puwei7788 情况如上所述,保存多个标签页可以用菜单中的Save unpinned tabs或者Save all tabs。
@anon23138622 情况如第一段所述,我在Chrome中测试无法支持本地网页。
是的. 不过我们之前讨论的是 html .
跟mhtml不一样.
所以我才说 html包含很多附属文件.
另外据我所知, mhtml 也无法100%实现一些代码的效果. 不过对于阅读来说足够用了.
你指的是一个文件带一个文件夹的,还是集成到一个文件中去的?
确实如此,我测试了下edge保存的mht,火狐打开看不见图片,所以阅读够不够还得实操决定。
个人认为这种情况可以通过开启 Everything 的 HTTP 服务器这办法来绕开。
开了以后就可以通过访问这个服务器来打开那些保存的网页,这时候无论 Save Page WE 还是 SingleFile 都能搞定。
这个应该比较接近题意,但其实也依赖js
膜拜大神,这招确实可行,骗过扩展进行保存。
在有更好的直接转换工具出现之前,这个方案是最优解了。
最终还是要合并啊,我现在遇到同样的问题,你现在想到办法合并html了嘛???