详解在Python程序中解析并修改XML内容的方法


Posted in Python onNovember 16, 2015

需求
在实际应用中,需要对xml配置文件进行实时修改,

1.增加、删除 某些节点

2.增加,删除,修改某个节点下的某些属性

3.增加,删除,修改某些节点的文本

使用xml文档

<?xml version="1.0" encoding="UTF-8"?>
<framework>
  <processers>
    <processer name="AProcesser" file="lib64/A.so"
      path="/tmp">
    </processer>
    <processer name="BProcesser" file="lib64/B.so" value="fordelete">
    </processer>
    <processer name="BProcesser" file="lib64/B.so2222222"/>

    <services>
      <service name="search" prefix="/bin/search?"
        output_formatter="OutPutFormatter:service_inc">

        <chain sequency="chain1"/>
        <chain sequency="chain2"></chain>
      </service>
      <service name="update" prefix="/bin/update?">
        <chain sequency="chain3" value="fordelete"/>
      </service>
    </services>
  </processers>
</framework>

实现思想
使用ElementTree,先将文件读入,解析成树,之后,根据路径,可以定位到树的每个节点,再对节点进行修改,最后直接将其输出

实现代码

#!/usr/bin/python
# -*- coding=utf-8 -*-
# author : wklken@yeah.net
# date: 2012-05-25
# version: 0.1

from xml.etree.ElementTree import ElementTree,Element

def read_xml(in_path):
  '''读取并解析xml文件
    in_path: xml路径
    return: ElementTree'''
  tree = ElementTree()
  tree.parse(in_path)
  return tree

def write_xml(tree, out_path):
  '''将xml文件写出
    tree: xml树
    out_path: 写出路径'''
  tree.write(out_path, encoding="utf-8",xml_declaration=True)

def if_match(node, kv_map):
  '''判断某个节点是否包含所有传入参数属性
    node: 节点
    kv_map: 属性及属性值组成的map'''
  for key in kv_map:
    if node.get(key) != kv_map.get(key):
      return False
  return True

#---------------search -----
def find_nodes(tree, path):
  '''查找某个路径匹配的所有节点
    tree: xml树
    path: 节点路径'''
  return tree.findall(path)

def get_node_by_keyvalue(nodelist, kv_map):
  '''根据属性及属性值定位符合的节点,返回节点
    nodelist: 节点列表
    kv_map: 匹配属性及属性值map'''
  result_nodes = []
  for node in nodelist:
    if if_match(node, kv_map):
      result_nodes.append(node)
  return result_nodes

#---------------change -----
def change_node_properties(nodelist, kv_map, is_delete=False):
  '''修改/增加 /删除 节点的属性及属性值
    nodelist: 节点列表
    kv_map:属性及属性值map'''
  for node in nodelist:
    for key in kv_map:
      if is_delete:
        if key in node.attrib:
          del node.attrib[key]
      else:
        node.set(key, kv_map.get(key))

def change_node_text(nodelist, text, is_add=False, is_delete=False):
  '''改变/增加/删除一个节点的文本
    nodelist:节点列表
    text : 更新后的文本'''
  for node in nodelist:
    if is_add:
      node.text += text
    elif is_delete:
      node.text = ""
    else:
      node.text = text

def create_node(tag, property_map, content):
  '''新造一个节点
    tag:节点标签
    property_map:属性及属性值map
    content: 节点闭合标签里的文本内容
    return 新节点'''
  element = Element(tag, property_map)
  element.text = content
  return element

def add_child_node(nodelist, element):
  '''给一个节点添加子节点
    nodelist: 节点列表
    element: 子节点'''
  for node in nodelist:
    node.append(element)

def del_node_by_tagkeyvalue(nodelist, tag, kv_map):
  '''同过属性及属性值定位一个节点,并删除之
    nodelist: 父节点列表
    tag:子节点标签
    kv_map: 属性及属性值列表'''
  for parent_node in nodelist:
    children = parent_node.getchildren()
    for child in children:
      if child.tag == tag and if_match(child, kv_map):
        parent_node.remove(child)

if __name__ == "__main__":
  #1. 读取xml文件
  tree = read_xml("./test.xml")

  #2. 属性修改
   #A. 找到父节点
  nodes = find_nodes(tree, "processers/processer")
   #B. 通过属性准确定位子节点
  result_nodes = get_node_by_keyvalue(nodes, {"name":"BProcesser"})
   #C. 修改节点属性
  change_node_properties(result_nodes, {"age": "1"})
   #D. 删除节点属性
  change_node_properties(result_nodes, {"value":""}, True)

  #3. 节点修改
   #A.新建节点
  a = create_node("person", {"age":"15","money":"200000"}, "this is the firest content")
   #B.插入到父节点之下
  add_child_node(result_nodes, a)

  #4. 删除节点
    #定位父节点
  del_parent_nodes = find_nodes(tree, "processers/services/service")
    #准确定位子节点并删除之
  target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, "chain", {"sequency" : "chain1"})

  #5. 修改节点文本
    #定位节点
  text_nodes = get_node_by_keyvalue(find_nodes(tree, "processers/services/service/chain"), {"sequency":"chain3"})
  change_node_text(text_nodes, "new text")

  #6. 输出到结果文件
  write_xml(tree, "./out.xml")

修改后的结果

<?xml version='1.0' encoding='utf-8'?>
<framework>
  <processers>
    <processer file="lib64/A.so" name="AProcesser" path="/tmp">
    </processer>
    <processer age="1" file="lib64/B.so" name="BProcesser">
      <person age="15" money="200000">this is the firest content</person>
    </processer>
    <processer age="1" file="lib64/B.so2222222" name="BProcesser">
      <person age="15" money="200000">this is the firest content</person>
    </processer>

    <services>
      <service name="search" output_formatter="OutPutFormatter:service_inc"
        prefix="/bin/search?">

        <chain sequency="chain2" />
      </service>
      <service name="update" prefix="/bin/update?">
        <chain sequency="chain3" value="fordelete">new text</chain>
      </service>
    </services>
  </processers>
</framework>
Python 相关文章推荐
Python中类的定义、继承及使用对象实例详解
Apr 30 Python
Python的Tornado框架实现图片上传及图片大小修改功能
Jun 30 Python
python直接访问私有属性的简单方法
Jul 25 Python
Python实现爬取需要登录的网站完整示例
Aug 19 Python
Python3.5内置模块之time与datetime模块用法实例分析
Apr 27 Python
python绘制直方图和密度图的实例
Jul 08 Python
python实现ip地址查询经纬度定位详解
Aug 30 Python
Python:二维列表下标互换方式(矩阵转置)
Dec 02 Python
使用Python发现隐藏的wifi
Mar 04 Python
使用jupyter notebook直接打开.md格式的文件
Apr 10 Python
Python txt文件常用读写操作代码实例
Aug 03 Python
Python如何发送与接收大型数组
Aug 07 Python
Python通过DOM和SAX方式解析XML的应用实例分享
Nov 16 #Python
Python的Flask开发框架简单上手笔记
Nov 16 #Python
python实现mysql的单引号字符串过滤方法
Nov 14 #Python
浅析Python中signal包的使用
Nov 13 #Python
Python下rrdtool模块的基本使用方法
Nov 13 #Python
简单了解Python下用于监视文件系统的pyinotify包
Nov 13 #Python
Python的pycurl包用法简介
Nov 13 #Python
You might like
js获取select选中的option的text示例代码
2013/12/19 Javascript
javascript 寻找错误方法整理
2014/06/15 Javascript
详解JavaScript逻辑And运算符
2015/12/04 Javascript
JavaScript jquery及AJAX小结
2016/01/24 Javascript
JavaScript隐式类型转换
2016/03/15 Javascript
基于javascript实现图片滑动效果
2016/05/07 Javascript
一个简单不报错的summernote 图片上传案例
2016/07/11 Javascript
浅谈javascript中的加减时间
2016/07/12 Javascript
Javascript 两种刷新方法以及区别和适用范围
2017/01/17 Javascript
vue.js路由跳转详解
2017/08/28 Javascript
详解Webstorm 下的Angular2.0开发之路(图文)
2018/12/06 Javascript
JavaScript惰性载入函数实例分析
2019/03/27 Javascript
pageGroup.js实现分页功能
2019/07/27 Javascript
layui 实现加载动画以及非真实加载进度的方法
2019/09/23 Javascript
vue 实现用户登录方式的切换功能
2020/04/14 Javascript
详解vue路由
2020/08/05 Javascript
基于JavaScript实现简单的轮播图
2021/03/03 Javascript
Django中使用locals()函数的技巧
2015/07/16 Python
python使用电子邮件模块smtplib的方法
2016/08/28 Python
Python设计实现的计算器功能完整实例
2017/08/18 Python
人工智能最火编程语言 Python大战Java!
2017/11/13 Python
django-rest-framework解析请求参数过程详解
2019/07/18 Python
Python Gitlab Api 使用方法
2019/08/28 Python
Python连接Oracle之环境配置、实例代码及报错解决方法详解
2020/02/11 Python
Python爬虫实现百度翻译功能过程详解
2020/05/29 Python
Python连接mysql数据库及简单增删改查操作示例代码
2020/08/03 Python
mac安装python3后使用pip和pip3的区别说明
2020/09/01 Python
纽约海:Sea New York
2018/11/04 全球购物
自我评价怎么写好呢?
2013/12/05 职场文书
幼儿园家长评语大全
2014/04/16 职场文书
服务承诺书怎么写
2014/05/24 职场文书
电气工程及其自动化专业求职信
2014/06/23 职场文书
2014年学校德育工作总结
2014/12/05 职场文书
2015年学校信息技术工作总结
2015/05/25 职场文书
goland 清除所有的默认设置操作
2021/04/28 Golang
详解SQL报错盲注
2022/07/23 SQL Server