网站数据粘贴后发现格式混乱,求解决方法

如题,网站的数据的原貌如下,

粘贴到excel后,变成了这幅鬼样子

试过很多的方法,比如excel调整文本格式,保存成html再用excel打开,都不管用,所以特来求助论坛大神

刚好我昨天也碰着类似问题了,还没找到办法,蹲一个解决方案~

盲猜是网站样式问题,程序识别到的内容和你看到的效果并不一致。

感谢,已经测试过了,你的方法并不适用,edge浏览器里ctrl + shift + x粘贴出来还是和直接粘贴效果是一样的,另外开启这个web select之后,页面是无法滚动的,这个就不是很方便,因为我的这个数据源表格可能有几千行

这种不给个页面别人也不好测试,不过貌似你这边也不太方便给:joy:

最好提供一下url

看源码.

如果是 <table> 标签的. 应该是没问题的.

就怕有些看着是表格, 其实是魔改的div.

你可以试试另存为 html, 然后用 word 打开. 记住是 word.

的确,涉及到内部的数据,不方便公开

不是很看得懂源码,我只看到elements的body部分有iframe、div、还有script标签,就是没有table标签

我把我的问题解决了!

方法是用的在线html转markdown工具,先转成markdown就好办了,随便用个markdown编辑器就搞定了。

不过你的文件涉密的话,我不知道哪里有离线的html 转markdown工具?

在线HTML转MarkDown工具 - ToolTT在线工具箱

我用的是这个网站,不知道是不是离线也能用,你可以试试把这个网站打开,然后断网,试试能不能转换markdown。

不行,转换以后还是这么长长的一条

这种数据导入 Excel 不行么?我觉得 Excel 可以解决啊

仔细看图一。。。尼玛这表格线都是错位的
估计就是网页设计的时候就是有问题 恐怕是没法导出导入了

感觉得换个思路了。。。试试截图+ocr识别的方案咧?

1 个赞

观察很仔细,给你小心心

试试 Excel 数据标签页 - 获取和转换数据 - 自网站 ?
不过如果是网页本身的布局有问题,那可能的确没啥好办法。

我也想到过,但是这个数据很长,有几千行,这样的话可首先需要一个滚动截图的工具

截屏的方案也失败了,不知道是网站的问题还是截屏工具的问题,拼接出来的长截图会漏掉一部分数据

搭配Remove HTML Elements 插件,先去掉右边列,转markdown
再去掉左边列,转markdown,试试?

Remove HTML Elements - Microsoft Edge Addons

edge商店就有。