能自由移除元素、使用模版的剪藏工具有哪些?Obsidian Web Clipper、毛线

1. Obsidian Web Clipper

Obsidian Web Clipper

Obsidian 的官方扩展,高亮只能选取,不能删除元素,所以就不是那么自由。

点击展开高亮图片

zvzRk4.highlight.jpeg

不过有个官方模版库,可以使用别人写好的模板
但是只有寥寥几个模版,而且看上去写起来好麻烦,对于我这种不懂网页知识的人来说,是没啥指望了。

2. MaoXian Web Clipper

毛线可以自由选取、删除元素,还能使用自定义规则,自动过滤、记忆裁剪区域,非常方便。
目前分享的规则有几十条,大多中文站点,写起来看上去要比 Ob 的简单。

但我不想要下载图片到本地,图片用链接即可,毛线没有这个选项。
所以我在写规则的时候干脆把图片和视频都删除了,这样保存的只有文本。

3. 简悦内置剪藏

可配置规则,隐藏列表,阅读模式可删除元素、保存,加入稍后读也可自动保存。

4. 大家还有什么比较方便的自定义剪藏工具?

我其实比较喜欢 Obsidian Web Clipper,配合 Ob 使用起来很整洁,但是不会写规则就比较麻烦。
毛线自由度更高,适合随手剪。
简悦规则没整明白,界面用起来略微卡顿,只是剪藏的话感觉有点笨重。

5. 模版

有模版很方便,没有模版就得自己整。

  • Obsidian Web Clipper

设置 - 模版 - 笔记内容 中输入,我自己研究了下,至少能用 :smile:

效果图

znX5AT.1.jpeg

模版
{{url}}
{{date}}

# {{title}}

{{selector:#pagetitle > ul.stats.clearfix > li.stat-version|markdown}}
{{selector:#fileinfo > div:nth-child(2)|markdown}}
{{selector:#fileinfo > div:nth-child(3)|markdown}}

## {{selector:#description_tab_h2|markdown}}

{{selector:#section > div > div.wrap.flex > div:nth-child(2) > div > div.tabcontent.tabcontent-mod-page > div.container.tab-description > p|markdown}}

## 详细说明

{{selectorHtml:div.container.mod_description_container.condensed|markdown}}

简悦,不是单一搞剪藏的,但是剪藏也拿手。可以对接notion、obsidian、joplin、为知、有道等等等等。

milanote ?

好,一会研究下,简悦我安装得有几年了,当时一看设置一大堆就再也没用过 :smile:

其实我不是重度网页文章资料需求者,就是想省点事,免去手动复制粘贴操作 :laughing:

是的,作者太专业,这软件太丰富了,设置太多了,可能会让人迷茫。不过如果你只用剪藏和同步到ob,就也没几个设置。

不行,这是个创作工具,剪藏是内置的,限制太多
非需求用户用不到这东西

简悦是不是有什么 bug,还是设置问题,我打开了一个很多图片的网页,非常卡,关掉就正常了

简悦这规则和动作写起来也不简单,也没找到个写法文档,对比着已经有的规则一点点来,头大

我之前折腾过简悦,后来不用了,可以作为一个备用工具。

折腾简悦有一个核心要义就是,简悦的绝大部分设置存在于一个本地 .json 文件里,配置时要注意多刷新页面。


我现在的剪藏方式是:

  • 删除元素(打开控制台删除、使用阅读模式一键删除)
  • 保存到本地(打印 pdf、全选复制、导出 html)

我现在不怎么剪藏了,偶尔遇见一两篇特别值得剪藏的,就手工去保存一下(搭配上一些半自动化工具即可)

对,我现在也是保存本地 md 文档,就当下载了个说明文档看,还能自由添加编辑内容,不用手动新建文档复制粘贴了。

简悦删除元素还可以用 uBlock 规则,只是我没找到他系统性的规则和动作编写文档,我这就认识个 id class 的门外汉写起来是真头大
毛线的写法文档就比较全面,照着他人的改改也能用

找着他的帮助文档了,吐槽这界面,真的是难用

我没有研究这些规则

  • 不懂网页知识:为了剪藏去学习有点绕远,偏离我想剪藏的本意。
  • 原汁原味的网站:原网站的主题、背景、字体、头图、排版,是独特的,有一番风味。剪藏出来会破坏掉,所以有时候我会使用 HTML 来整体保存,不去格式。
  • 转化为笔记:有很多文章,直接提炼信息,记成笔记,就跳过了剪藏这一步。
  • 剪藏精品:提高剪藏的质量,降低数量。可能就不太需要依赖这些规则了,手动剪藏一篇好文章,动动手也是值得的。

简悦的官方文档不太易读,简悦早期宣传的时候有点依赖社区用户帮着分享教程和心得(我也给简悦写过一篇)

其实对于剪藏来说,最好的还是用cubox之类的商业软件,别人都给你弄好了,你只需要使用,舒舒服服的。当然,(可能)唯一缺点是需要付费。

我曾经用过 Cubox,早期保存的网页,不仅快照丢失,有些本体都没了(相应条目点进去一直加载)。

Cubox 可以用作稍后读,但是不能作为剪藏。

剪藏的基本需求是防止信息丢失,让数据在本地保存。Cubox 没做好这一点。

过去wiz用ziw格式存储html内容,可以自定义xpath采集网页内容并且用css指定渲染方式.
现在已经没得玩了,噢我的白月光

我也好几年没用了,特意进去看了看,还没发现你这个问题,原网页已经没有了的信息也可以正常看。不过我现在也是简悦导出离线html,毕竟是小众需求,按年付费还是觉得没必要。

大部分正常,只有个别文章彻底挂了(挂的文章大都沾点历史敏感话题,但我想找回来看也正是因为这一点… )

终于搞定自动隐藏元素了,才发现手动选取能自动添加到隐藏列表里 :sweat_smile:
似乎还不行,切换另一个页面隐藏列表就不行了 :melting_face:

再问下,简悦一键自动保存应该怎么设置,比如我用快捷键进入阅读模式,但还得手动点击保存

另外,它在文本开头添加的 本文由 简悦 SimpRead 转码 这句该怎么去掉
保存的文件名能根据模版设置吗,现在的文件名 simpread-title.md,太长了我还得手动改

简悦有个让人犯强迫症的地方在于,会在底部给你留下一个元素,大概是“本文由简悦保存”之类的。

其他元素都去除了,但是这个元素去除不了

我好久没用简悦了,我刚才打开熟悉了一下。

你说的一键保存具体是什么?是保存到简悦的稍后读还是导出为 pdf 文件之类的?

我记得简悦配置好后好像是先“保存到稍后读”,然后再进一步触发更多的操作,导出文件需要“简悦同步助手”。


应该是这里,只要保存到“稍后读”,“稍后读”本质就是:这篇文章写入了简悦的那个 .json 文件。

可以不进入阅读模式,直接保存到稍后读。

保存到稍后读,如果搭配同步助手,可以再触发导出各种格式的文件。

这个貌似去不了

记得当初简悦让我犯强迫症的三个地方:

  • 本文由 简悦 SimpRead 转码
  • 标题下面的摘要去不掉(很多文章的摘要抓不准,这个不能说是简悦的问题,是网站的问题,或者文章本身就没有摘要,但是我在简悦这边关不掉…)
  • 坚果云同步只能同步到根目录

去掉这句话的办法,可能是:导出为 markdown 到 Obsidian 或 Vs Code,再用批量方法或自动化方法去除。

哦对,应该就是这个稍后读,我看他提供了一个自动导入 Obsidian 的配置,不过需要助手,那我就直接简单导出为 md 就好了。

刚又把 Obsidian Web Clipper 的模版研究了下,发现还挺好用的,可以直接保存为本地 .md 文档,也能以文本形式保存 html 样式,可以试试,我在主题里发了效果

single file
print edit we
save page we