python导出chrome书签到markdown文件的实例代码


Posted in Python onDecember 27, 2017

python导出chrome书签到markdown文件,主要就是解析chrome的bookmarks文件,然后拼接成markdown格式的字符串,最后输出到文件即可。以下直接上代码,也可以在 py-chrome-bookmarks-markdown 中直接参见源码。

from json import loads
import argparse
from platform import system
from re import match
from os import environ
from os.path import expanduser
# 过滤name
filter_name_list = {'My work', '书签栏', 'websites'}
html_escape_table = {
  "&": "&",
  '"': """,
  "'": "'",
  ">": ">",
  "<": "<",
}
output_file_template = """
<h3>书签目录</h3>
{catelog}
{bookmark_bar}
{other}
"""
# 如需本地调试可注释掉这一段 START
parser = argparse.ArgumentParser(formatter_class=argparse.RawDescriptionHelpFormatter,
                 description="python导出chrome书签到markdown文件.")
parser.add_argument("input_file", type=argparse.FileType('r', encoding='utf-8'), nargs="?",
          help="读取书签的位置,可以指定文件位置(相对路径,绝对路径都可以),非必填,默认为Chrome的默认书签位置")
parser.add_argument("output_file", type=argparse.FileType('w', encoding='utf-8'),
          help="读取书签的位置,可以指定文件位置(相对路径,绝对路径都可以),必填")
args = parser.parse_args()
if args.input_file:
  input_file = args.input_file
else:
  if system() == "Darwin":
    input_filename = expanduser("~/Library/Application Support/Google/Chrome/Default/Bookmarks")
  elif system() == "Linux":
    input_filename = expanduser("~/.config/google-chrome/Default/Bookmarks")
  elif system() == "Windows":
    input_filename = environ["LOCALAPPDATA"] + r"\Google\Chrome\User Data\Default\Bookmarks"
  else:
    print('Your system ("{}") is not recognized. Please specify the input file manually.'.format(system()))
    exit(1)
  try:
    input_file = open(input_filename, 'r', encoding='utf-8')
  except IOError as e:
    if e.errno == 2:
      print("The bookmarks file could not be found in its default location ({}). ".format(e.filename) +
         "Please specify the input file manually.")
      exit(1)
output_file = args.output_file
# 如需本地调试可注释掉这一段 END
# 本地调试可以指定文件名测试 START
# input_filename = 'C:/Users/Administrator/AppData/Local/Google/Chrome/User Data/Default/Bookmarks'
# input_file = open(input_filename, 'r', encoding='utf-8')
# output_file_name = 'test2.md'
# output_file = open(output_file_name, 'w', encoding='utf-8')
# 本地调试可以指定文件名测试 END
# 目录
catelog = list()
def html_escape(text):
  return ''.join(html_escape_table.get(c, c) for c in text)
def html_for_node(node):
  # 判断url和children即判断是否包含在文件夹中
  if 'url' in node:
    return html_for_url_node(node)
  elif 'children' in node:
    return html_for_parent_node(node)
  else:
    return ''
def html_for_url_node(node):
  if not match("javascript:", node['url']):
    return '- [{}]({})\n'.format(node['name'], node['url'])
  else:
    return ''
def html_for_parent_node(node):
  return '{0}\n\n{1}\n'.format(filter_catelog_name(node),
                 ''.join([filter_name(n) for n in node['children']]))
# 过滤文件夹
def filter_name(n):
  if n['name'] in filter_name_list:
    return ''
  else:
    return html_for_node(n)
# 过滤目录名
def filter_catelog_name(n):
  if n['name'] in filter_name_list:
    return ''
  else:
    catelog.append('- [{0}](#{0})\n'.format(n['name']))
    return '<h4 id={0}>{0}</h4>'.format(n['name'])
contents = loads(input_file.read())
input_file.close()
bookmark_bar = html_for_node(contents['roots']['bookmark_bar'])
other = html_for_node(contents['roots']['other'])
catelog_str = ''.join(a for a in catelog)
output_file.write(output_file_template.format(catelog=catelog_str, bookmark_bar=bookmark_bar, other=other))

导出示例: https://github.com/kent666a/kent-resources/blob/master/bookmarks.md

总结

以上所述是小编给大家介绍的python导出chrome书签到markdown文件的实例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
从零学python系列之新版本导入httplib模块报ImportError解决方案
May 23 Python
Python实现拼接多张图片的方法
Dec 01 Python
Python排序搜索基本算法之冒泡排序实例分析
Dec 09 Python
python实现TF-IDF算法解析
Jan 02 Python
Python迭代器定义与简单用法分析
Apr 30 Python
python实现俄罗斯方块
Jun 26 Python
python3基于OpenCV实现证件照背景替换
Jul 18 Python
pip指定python位置安装软件包的方法
Jul 12 Python
python GUI库图形界面开发之PyQt5布局控件QGridLayout详细使用方法与实例
Mar 06 Python
Python退出时强制运行一段代码的实现方法
Apr 29 Python
浅谈cv2.imread()和keras.preprocessing中的image.load_img()区别
Jun 12 Python
Ubuntu权限不足无法创建文件夹解决方案
Nov 14 Python
Python类的继承和多态代码详解
Dec 27 #Python
快速查询Python文档方法分享
Dec 27 #Python
Java及python正则表达式详解
Dec 27 #Python
python matplotlib画图实例代码分享
Dec 27 #Python
python爬虫使用cookie登录详解
Dec 27 #Python
Python爬虫番外篇之Cookie和Session详解
Dec 27 #Python
Python并发编程协程(Coroutine)之Gevent详解
Dec 27 #Python
You might like
PHP处理Json字符串解码返回NULL的解决方法
2014/09/01 PHP
php自动识别文字编码并转换为目标编码的方法
2015/08/08 PHP
PHP删除字符串中非字母数字字符方法总结
2019/01/20 PHP
php设计模式之适配器模式原理、用法及注意事项详解
2019/09/24 PHP
Javascript的常规数组和关联数组对比小结
2012/05/24 Javascript
jquery获取元素值的方法(常见的表单元素)
2013/11/15 Javascript
jQuery简易图片放大特效示例代码
2014/06/09 Javascript
超级好用的jQuery圆角插件 Corner速成
2014/08/31 Javascript
Javascript数组操作函数总结
2015/02/05 Javascript
JS简单实现tab切换效果的多窗口显示功能
2016/09/07 Javascript
详解微信小程序 页面跳转 传递参数
2016/12/08 Javascript
利用transition实现文字上下抖动的效果
2017/01/21 Javascript
js判断是否是手机页面
2017/03/17 Javascript
js实现ATM机存取款功能
2020/10/27 Javascript
vue router动态路由设置参数可选问题
2019/08/21 Javascript
vue移动端实现手机左右滑动入场动画
2020/06/17 Javascript
Vue 电商后台管理项目阶段性总结(推荐)
2020/08/22 Javascript
python实现简单温度转换的方法
2015/03/13 Python
matplotlib绘图实例演示标记路径
2018/01/23 Python
python机器人行走步数问题的解决
2018/01/29 Python
详解python实现线程安全的单例模式
2018/03/05 Python
python 实现求解字符串集的最长公共前缀方法
2018/07/20 Python
tensorflow实现在函数中用tf.Print输出中间值
2020/01/21 Python
python3注册全局热键的实现
2020/03/22 Python
伦敦哈德森鞋:Hudson Shoes
2018/02/06 全球购物
下列程序在32位linux或unix中的结果是什么
2015/01/26 面试题
临床医学专业个人的自我评价
2013/09/27 职场文书
军训教官感言
2014/03/02 职场文书
医疗专业毕业生求职信
2014/08/28 职场文书
与美同行演讲稿
2014/09/13 职场文书
股指期货心得体会
2014/09/13 职场文书
党员四风自我剖析材料思想汇报
2014/09/13 职场文书
学习群众路线的心得体会
2014/11/05 职场文书
党建工作目标管理责任书
2015/01/29 职场文书
幼儿园父亲节活动总结
2015/02/12 职场文书
廉政承诺书范文
2015/04/28 职场文书