如题,网站的数据的原貌如下,
粘贴到excel后,变成了这幅鬼样子
试过很多的方法,比如excel调整文本格式,保存成html再用excel打开,都不管用,所以特来求助论坛大神
刚好我昨天也碰着类似问题了,还没找到办法,蹲一个解决方案~
盲猜是网站样式问题,程序识别到的内容和你看到的效果并不一致。
感谢,已经测试过了,你的方法并不适用,edge浏览器里ctrl + shift + x粘贴出来还是和直接粘贴效果是一样的,另外开启这个web select之后,页面是无法滚动的,这个就不是很方便,因为我的这个数据源表格可能有几千行
这种不给个页面别人也不好测试,不过貌似你这边也不太方便给
看源码.
如果是 <table>
标签的. 应该是没问题的.
就怕有些看着是表格, 其实是魔改的div.
你可以试试另存为 html, 然后用 word 打开. 记住是 word.
的确,涉及到内部的数据,不方便公开
不是很看得懂源码,我只看到elements的body部分有iframe、div、还有script标签,就是没有table标签
我把我的问题解决了!
方法是用的在线html转markdown工具,先转成markdown就好办了,随便用个markdown编辑器就搞定了。
不过你的文件涉密的话,我不知道哪里有离线的html 转markdown工具?
在线HTML转MarkDown工具 - ToolTT在线工具箱
我用的是这个网站,不知道是不是离线也能用,你可以试试把这个网站打开,然后断网,试试能不能转换markdown。
这种数据导入 Excel 不行么?我觉得 Excel 可以解决啊
仔细看图一。。。尼玛这表格线都是错位的
估计就是网页设计的时候就是有问题 恐怕是没法导出导入了
感觉得换个思路了。。。试试截图+ocr识别的方案咧?
观察很仔细,给你小心心
试试 Excel 数据标签页 - 获取和转换数据 - 自网站 ?
不过如果是网页本身的布局有问题,那可能的确没啥好办法。
我也想到过,但是这个数据很长,有几千行,这样的话可首先需要一个滚动截图的工具
截屏的方案也失败了,不知道是网站的问题还是截屏工具的问题,拼接出来的长截图会漏掉一部分数据
搭配Remove HTML Elements 插件,先去掉右边列,转markdown
再去掉左边列,转markdown,试试?