大家好!
知乎的一个话题,一旦有了三四年后,答案的数量可能达到好几百好几千。
虽然安装了 Chrome 脚本,可以自动加载答案,但答案并不是一次性的全部加载完成的,需要按 End 键到网页的底部,才会自动加载答案。
但一直按住 End 的键,好几十分钟,仍然没有完全的加载完成。
我的需求是,答案可以迅速的加载完成,或者一键导出为没有图片的 html,我之后再将答案复制到 workflowy 中进行整理。
我需要导出所有答案的是这个链接:
有哪些 100 元以下,实用且贴心,用了之后相见恨晚甚至感动出泪的东西? - 知乎 https://www.zhihu.com/question/27509931
dms
7
我写出来了,效率还可以,你举例的问题差不多一分钟搞定吧。
但是……这样的东西就不好放出来了。
我就加了些限制,每十秒抓取一页(20 个答案),只能抓取大约 60% 的内容。我觉得一般情况足够用了吧,而且内容太多网页显示出来会卡崩掉的。
小书签
既然楼主的问题解决了
这个还是隐去吧
毕竟这种东西虽然没什么技术含量
但是被某些盗文者获得还是很烦的
我不想与之相关
小众也不提倡讨论这些东西
散啦散啦,回家次饭~
1 个赞
今天又试了这个脚本,发现只能获取每个答案的10%,或者仅仅是摘要的内容,而不是全文的内容。
请问 @dms,这个脚本还有机会改善么?
以前有zhihuhelp脚本的,后来大概知乎各种改接口各种反爬虫渐渐挂掉了
对我来说翻页不是什么问题,也不需要脚本,但是翻多了就卡死了
其实以现在知乎的回答质量,也就少数自然科学类能分清对错的东西有参考意义,剩下的很多都是“泻药,人在蒙古,刚下航母,华尔街认识我的比较多,匿了”
初步用这个在线的 json 转换为 csv 后(https://json-csv.com/,这个网站只能一天转换一次),再将 html部分的内容,复制到记事本,然后保存为 html 可以打开。
虽然需求是没有图片的。不过保存的 html 没有加载图片,反而阅读起来有点茫然。
然后发现好像有692个答案,考虑有20个文章的上限,这意味着仍然要反复下载、转换、合并,个人感觉折腾起来仍然需要半个小时以上,似乎仍然没有达到省时省力的目的。
期望能有更好的方案。
完美的解决方案!
我把脚本保存为 Chrome 书签,并把数值0.6改为1后,692个答案导出在一个页面之中,然后通过 Chrome 的PDF 打印功能,导出为 PDF,最后把 PDF 导入到 iPad Pro 的 LiquidText 中阅读~
完美!
谢谢 @dms !也给你安利一下 LquidText,比 MarginNote 更好的做思维导图的阅读工具。