知乎现在不能用waybackmarchine做archive了,只好用singlefile
目前遇到的问题是评论要点个按钮才能全部展开,而且页面是翻到底部才加载下一页
去greasy fork搜一下, 好像有自动展开的脚本
之前论坛的一个类似提问,貌似没有方案
回答還好,評論是分頁的沒辦法。
或许可以用已有的自动化脚本识别需要点击的位置和向下滚动的边界?
評論不同頁內容都不會同時存在,除非拼接在一起,不過這也不是Singlefile應該做的事,靜態頁面越來越少了。
是个问题,看了下现在"打开全部评论"是以弹窗的形式展现的,只能用更复杂的脚本来提取了,singlefile现在可能不够,至多只能提取部分展开评论的第一页,不过也还可以了总比没有强
“评论要点个按钮才能全部展开”我可以写一个自动点击展开脚本,不过全部评论那个弹窗不太好解决(也可以解决,就直接把它移动到某个位置,就是麻烦)
粗略的功能写好了
太感谢了
试用了下已经实现靠前的几个答案回复的第一次展开,很好用。
bug:
展开几个回答的评论之后就会出现类似点击"点击查看全部评论"后出现的评论弹窗,同时cpu占用率有点高,然后流程貌似就被打断了。
展开了一部分评论被打断的页面,少量"XXX条评论"的链接被点击后会直接打开全部评论的弹窗
另外有时候页面加载可能比较慢,不知道延迟够不够
有时页面会有个"点击显示全部回答"按钮,貌似也会导致一些靠前答案的回复没有被展开
“评论弹窗”这个我暂时没搞清楚怎么解决,暂时就加了行代码点击关闭按钮
“评论被打断的页面”被打断是什么意思
“另外有时候页面加载可能比较慢,不知道延迟够不够”目前是滚动10秒然后就模拟点击了
被打断是指"试图展开所有回答下评论"的过程被打断。
伸手党表示现在已经很好用了,保存知乎就是想留个见证,平时看到很多帖子莫名其妙的被消失太气人了。
我也是研究过archive.org保存知乎失败的问题,我是用singlefile保存到了github上。
知乎的延迟不太稳定,有时候载入一个回答下面的评论需要10几秒
页面到底自动载入更多也是一样,尤其是当已经载入了很多回答之后,自动操作就没了,手动展开也会越来越慢。貌似太多的内容也会让zhihu或者chrome本身卡顿
比如这个华为新瓜,之后大概耗费了1小时的时间还没有手动展开完毕所有回答和回答项目的回复,好在是一边看片子一边操作
https://www.zhihu.com/question/655565411
“耗费了1小时的时间”全展开还能保存下来吗,singlefile会很卡吧。估计得上百MB
// 如果执行次数达到 10 次,则停止定时器 if (count === 10) {
你要是想多等一段时间,就改这个10,10就是10秒
document.querySelector(“div.css-1aq8hf9 > button”).click()
}, 11000);
然后改这个11000,11000是11秒
谢谢,我试一下其他的延时
用的1个小时。。。中间在看片,断断续续的想起来就手动加载,点展开评论,直到最后全部手动加载展开完了
其实也没有花很多时间在操作上,最后的singlefile.htm是25M
你好,我想搜集一个开放网站的问题与答案,页面会展示所有问题,答案只需要点击问题就可以看到,但是需要一个一个点开,可以小额付费帮忙解决一下吗?这个是问题页面 常见问题 | Interactive Brokers Hong Kong Limited(盈透证券香港有限公司)
“搜集一个开放网站的问题与答案” 搜集成什么形式呢
大概的操作是哪些