求教,Zotero如何让网页快照只抓取指定部分?

尝试修改translators,让快照只保存选中的部分,不成功

	newItem.attachments.push({
		url: url,
		title: 'Snapshot',
		document: **doc.querySelector("#js_content")**
	});

或者用SingleFile保存选中部分,然后拖到Zotero里面,但这样步骤有些繁琐

求教各位大佬指点

SingleFile是一个办法,本来Zotero用的也是SingleFile。
当然我是先用其他扩展把界面的元素给剔除掉再保存的。

也可以考虑用 MarkDownload 只抓取正文部分的 Markdown 格式文档,再把 Markwon 转成 HTML,存进 Zotero。

Firefox 版:

Chrome 版搬运:

这个方法对大部分论文出版商都是有用的,目前已经在 ScienceDirect、SpringerLink、Wiley Online Library、SciEngine、Taylor & Francis Online 和 Nature 上试过,都能正确抓取正文部分。

又多了一步markdown转html :rofl:

目前就是这样处理,就是感觉有点繁琐,不够自动化

还有个想法:或许可以先用 uBO 等插件,添加自定义规则,将目标网站的所有与目标元素无关的内容全屏蔽掉,然后再让 Zotero 抓取。

比如,某网站的原始网页是这样的:

1.webp

用 uBO 屏蔽掉其他元素:

2.webp

然后,如果再访问该网站的其他页面,刚刚删掉的元素也是会消失的:

3.webp

如果需要让这些内容再展示出来,可以对当前网站临时关闭 uBO。这样干其实是多了一步开关 uBO 的操作。


至于您刚刚的问题:

这个确实是个人习惯的问题。我都是直接看 Markdown 的,下载下来的 Markdown 作为附件存到条目下,Zotero 只是存个元数据,比如这样:

5.webp

我是用 Zotero 管理文献的,除此之外平时没有剪藏网页的需求,因此不怎么关注用 Zotero 抓取 HTML。对我而言,最有价值的就是论文的正文,因此我更喜欢直接抓取 Markdown 格式的论文正文,然后用其他 Markdown 编辑/阅读器打开。

简悦插件可以实现,但我用下来感觉也不算很方便

那你要不试试Save Page WE扩展,它可以选择范围内和选择范围外保存,比较灵活。
但它的缺点是只是隐藏,就是说保存的html体积会比较大。

ubo确实有效,搞好规则后,可以针对某一网站批量保存

markdown也挺好,就是zotero不能直接浏览,要再开个阅读器,还是喜欢一个流程内的事务用一个软件搞定

试了下,简悦的阅读效果很好,就是导入到zotero的快照显示空白页面

只是隐藏的话,就不如用小书签直接删除其他元素了

我按这个教程做是可以的,不知道是不是因为我是高级账户?免费账户剪藏导出好像有限制