求HTML批量转Markdown工具

有几千个.html文件想要转成.md文件,找了一圈没发现转换工具,求推荐。

md不是html的子集?
这也能转换的吗?

听起来就好像音频转成视频一样.

也不对。好像在在线HTML转MD的抓取工具,那应该是能转换。

可以的,有很多web工具支持,比如 http://www.atoolbox.net/Tool.php?Id=715 ,但一般不支持批量转。

可以用 python 写个小脚本,用 html2text 批量转换就行

我用Pandoc转Markdown折腾得已经崩溃,目前就想找个图形化的一键转换工具。

如果有使用Quicker,可以试试这个动作:
https://getquicker.net/sharedaction?code=dd3235c6-1710-493b-f861-08d8e37a0602

Html文档的内容可能比较复杂,有可能无法理想的转换为markdown。

另外还做了一个将选中的网页内容转换为MD的动作:
https://getquicker.net/sharedaction?code=946817bf-7a6f-4fd7-f862-08d8e37a0602

如果你使用其它工具,也可以使用Quicker提供的在线API进行处理:
https://tools.getquicker.cn

2 Likes

感谢Quicker开发大大特别写的动作,受宠若鸡,十分好用!因为用爬虫工具从网站爬取文章,只能输出html格式,不方便编辑所以想转md格式保存。可能原文章就是用Markdown编写的吧,Quicker转换后的效果近乎完美,放两张对比图:


1 Like

看起来不错~~
:grin:
这个也不是特别写的,之前就有考虑做一些公共的API可以调用,减少用户本地安装过多的依赖。markdown转换就是考虑的API之一了,只是一直没有动手,看到你的这个问题,我感觉可以开始搞一下了。

这个API代码是开源的,有需求的同学也可以自己部署。

乐于助人,支持