编程 Python

在Python中处理XML的教程

Posted in Python onApril 29, 2015

XML虽然比JSON复杂，在Web中应用也不如以前多了，不过仍有很多地方在用，所以，有必要了解如何操作XML。
DOM vs SAX

操作XML有两种方法：DOM和SAX。DOM会把整个XML读入内存，解析为树，因此占用内存大，解析慢，优点是可以任意遍历树的节点。SAX是流模式，边读边解析，占用内存小，解析快，缺点是我们需要自己处理事件。

正常情况下，优先考虑SAX，因为DOM实在太占内存。

在Python中使用SAX解析XML非常简洁，通常我们关心的事件是start_element，end_element和char_data，准备好这3个函数，然后就可以解析xml了。

举个例子，当SAX解析器读到一个节点时：

<a href="/">python</a>

会产生3个事件：

start_element事件，在读取<a href="/">时；
char_data事件，在读取python时；
end_element事件，在读取</a>时。

用代码实验一下：

from xml.parsers.expat import ParserCreate

class DefaultSaxHandler(object):
  def start_element(self, name, attrs):
    print('sax:start_element: %s, attrs: %s' % (name, str(attrs)))

  def end_element(self, name):
    print('sax:end_element: %s' % name)

  def char_data(self, text):
    print('sax:char_data: %s' % text)

xml = r'''<?xml version="1.0"?>
<ol>
  <li><a href="/python">Python</a></li>
  <li><a href="/ruby">Ruby</a></li>
</ol>
'''
handler = DefaultSaxHandler()
parser = ParserCreate()
parser.returns_unicode = True
parser.StartElementHandler = handler.start_element
parser.EndElementHandler = handler.end_element
parser.CharacterDataHandler = handler.char_data
parser.Parse(xml)

当设置returns_unicode为True时，返回的所有element名称和char_data都是unicode，处理国际化更方便。

需要注意的是读取一大段字符串时，CharacterDataHandler可能被多次调用，所以需要自己保存起来，在EndElementHandler里面再合并。

除了解析XML外，如何生成XML呢？99%的情况下需要生成的XML结构都是非常简单的，因此，最简单也是最有效的生成XML的方法是拼接字符串：

L = []
L.append(r'<?xml version="1.0"?>')
L.append(r'<root>')
L.append(encode('some & data'))
L.append(r'</root>')
return ''.join(L)

如果要生成复杂的XML呢？建议你不要用XML，改成JSON。
小结

解析XML时，注意找出自己感兴趣的节点，响应事件时，把节点数据保存起来。解析完毕后，就可以处理数据。

练习一下解析Yahoo的XML格式的天气预报，获取当天和最近几天的天气：

http://weather.yahooapis.com/forecastrss?u=c&w=2151330

参数w是城市代码，要查询某个城市代码，可以在weather.yahoo.com搜索城市，浏览器地址栏的URL就包含城市代码。

在Python中处理XML的教程

- Author -

廖雪峰

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

使用python实现baidu hi自动登录的代码

Feb 10 Python

python批量修改文件后缀示例代码分享

Dec 24 Python

浅谈Python 字符串格式化输出(format/printf)

Jul 21 Python

python脚本作为Windows服务启动代码详解

Feb 11 Python

Python爬虫工程师面试问题总结

Mar 22 Python

Jupyter中直接显示Matplotlib的图形方法

May 24 Python

Windows下Anaconda2安装NLTK教程

Sep 19 Python

Django 创建/删除用户的示例代码

Jul 24 Python

python如何使用Redis构建分布式锁

Jan 16 Python

浅谈Pycharm最有必要改的几个默认设置项

Feb 14 Python

Spark处理数据排序问题如何避免OOM

May 21 Python

Python3.9最新版下载与安装图文教程详解(Windows系统为例)

Nov 28 Python

python搜索指定目录的方法

Apr 29 #Python

python中sleep函数用法实例分析

Apr 29 #Python

介绍Python中内置的itertools模块

Apr 29 #Python

python使用fileinput模块实现逐行读取文件的方法

Apr 29 #Python

python将字符串转换成数组的方法

Apr 29 #Python

Python中使用hashlib模块处理算法的教程

Apr 28 #Python

简单介绍Python中的struct模块

Apr 28 #Python

You might like

php中变量及部分适用方法

2008/03/27 PHP

在WordPress中安装使用视频播放器插件Hana Flv Player

2016/01/04 PHP

PHP开发之归档格式phar文件概念与用法详解【创建,使用,解包还原提取】

2017/11/17 PHP

PHP容器类的两种实现方式示例

2019/07/24 PHP

Thinkphp框架使用list_to_tree 实现无限级分类列出所有节点示例

2020/04/04 PHP

用js实现上传图片前的预览（TX的面试题）

2007/08/14 Javascript

JObj预览一个JS的框架

2008/03/13 Javascript

Jquery实现网页跳转或用命令打开指定网页的解决方法

2013/07/09 Javascript

jquery $(this).attr $(this).val方法使用介绍

2013/10/08 Javascript

实现51Map地图接口(示例代码)

2013/11/22 Javascript

window.open()实现post传递参数

2015/03/12 Javascript

javascript巧用eval函数组装表单输入项为json对象的方法

2015/11/25 Javascript

jQuery toggle 代替方法

2016/03/22 Javascript

从零开始实现Vue简单的Toast插件

2018/12/03 Javascript

详解微信小程序用定时器实现倒计时效果

2019/04/30 Javascript

vue项目中定义全局变量、函数的几种方法

2019/11/08 Javascript

jQuery带控制按钮轮播图插件

2020/07/31 jQuery

vue监听滚动事件的方法

2020/12/21 Vue.js

[01:50]WODOTA制作 DOTA2中文宣传片《HERO》

2013/04/28 DOTA

Python函数中定义参数的四种方式

2014/11/30 Python

python实现端口转发器的方法

2015/03/13 Python

python清除字符串里非数字字符的方法

2015/07/02 Python

Python图像处理库PIL中图像格式转换的实现

2020/02/26 Python

Python操控mysql批量插入数据的实现方法

2020/10/27 Python

CSS3+js实现简单的时钟特效

2015/03/18 HTML / CSS

HTML5学习笔记之History API

2015/02/26 HTML / CSS

Alba Moda瑞士网上商店：独家意大利时尚女装销售

2016/11/28 全球购物

八年级数学教学反思

2014/01/31 职场文书

总经理工作职责范文

2014/03/14 职场文书

2015新年联欢晚会开场白

2014/12/14 职场文书

初中家长评语大全

2014/12/26 职场文书

事业单位年度考核个人总结

2015/02/12 职场文书

2015年会计个人工作总结

2015/04/02 职场文书

辞职信格式范文

2015/05/13 职场文书

五星级酒店宣传口号

2015/12/25 职场文书