我们日常浏览网站的时候,时不时会遇到些新奇的东西( 尤其是昨天还在更新的程序设计博客,今天就挂了永不更新。可是无论是Google浏览器还是国内浏览器,最多也就提供一个对于收藏夹的备份服务,那只能Python走起了。对于收藏夹提供的支持很少,主要还是因为收藏夹藏在浏览器里面,我们只能手动导出htm文件进行管理内容比较简单,对前端没什么了解的我,也可以很明显看出其中的树形结构和内在逻辑。很简单的想到了正则匹配,其中有两个子串。提取出来再挨个访问,看看哪个失效了,就删除,就能获得清理后的收藏夹了。程序执行情况导出htm实际应用于我的浏览器确实有很多电影网都失效了,通过Python能够一键清理其中无法访问的书签。
暂无评论