如题,有chrome和edge各一份书签。
edge的书签是从chrome的书签而来的。
想在想整理下书签,把这2各书签去重后再合并。 有啥办法不
应该有什么插件可以做到吧,可以等等看有没有。
Edge和Chrome的收藏夹导出的html格式貌似是一样的,我之前也有整理书签的需求,所以用GPT写了一个python,可以把这种html转换成excel表。
不过我是为了把收藏夹的网址扔进我的导航页,所以没有整理完导回浏览器的需求,所以没有写转回去的程序。
代码很短我直接贴这儿吧
import pandas as pd
from bs4 import BeautifulSoup
# 读取HTML文件
with open('favorites.html', 'r', encoding='utf-8') as file:
html_content = file.read()
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html_content, 'html.parser')
# 创建一个空的DataFrame来存储数据
df = pd.DataFrame(columns=['分类', '网页标题', '网页链接', '网页图标'])
# 查找所有的分类
categories = soup.find_all('h3')
data_to_concat = []
for category in categories:
category_name = category.text.strip()
# 查找当前分类下的所有链接
links = category.find_next('dl').find_all('a')
for link in links:
link_title = link.text.strip()
link_url = link['href']
link_icon = link.get('icon', '')
# 将数据添加到待添加数据列表
data_to_concat.append([category_name, link_title, link_url, link_icon])
# 将数据合并到DataFrame中
df = pd.concat(
[df, pd.DataFrame(data_to_concat, columns=df.columns)], ignore_index=True)
# 将DataFrame保存为Excel文件
df.to_excel('bookmarks.xlsx', index=False, engine='openpyxl')
print('数据已成功保存为Excel文件。')
1 个赞
52上找找好了,去重的很多的,之前用过一个去重+去无法访问的
1 个赞
有一个插件叫做eversync可以同步和merge书签