浏览器书签去重和合并

如题,有chrome和edge各一份书签。
edge的书签是从chrome的书签而来的。
想在想整理下书签,把这2各书签去重后再合并。 有啥办法不

应该有什么插件可以做到吧,可以等等看有没有。

Edge和Chrome的收藏夹导出的html格式貌似是一样的,我之前也有整理书签的需求,所以用GPT写了一个python,可以把这种html转换成excel表。

不过我是为了把收藏夹的网址扔进我的导航页,所以没有整理完导回浏览器的需求,所以没有写转回去的程序。

代码很短我直接贴这儿吧

import pandas as pd
from bs4 import BeautifulSoup

# 读取HTML文件
with open('favorites.html', 'r', encoding='utf-8') as file:
    html_content = file.read()

# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html_content, 'html.parser')

# 创建一个空的DataFrame来存储数据
df = pd.DataFrame(columns=['分类', '网页标题', '网页链接', '网页图标'])

# 查找所有的分类
categories = soup.find_all('h3')
data_to_concat = []

for category in categories:
    category_name = category.text.strip()

    # 查找当前分类下的所有链接
    links = category.find_next('dl').find_all('a')
    for link in links:
        link_title = link.text.strip()
        link_url = link['href']
        link_icon = link.get('icon', '')

        # 将数据添加到待添加数据列表
        data_to_concat.append([category_name, link_title, link_url, link_icon])

# 将数据合并到DataFrame中
df = pd.concat(
    [df, pd.DataFrame(data_to_concat, columns=df.columns)], ignore_index=True)

# 将DataFrame保存为Excel文件
df.to_excel('bookmarks.xlsx', index=False, engine='openpyxl')

print('数据已成功保存为Excel文件。')
1 个赞

52上找找好了,去重的很多的,之前用过一个去重+去无法访问的

1 个赞

之前用的这个 https://www.52pojie.cn/thread-1505111-1-1.html

有一个插件叫做eversync可以同步和merge书签

可以使用chrome插件Supersort进行书签的自动去重排序,至于书签的同步可以使用floccus进行多个浏览器的同步