Python3 xml.etree.ElementTree支持的XPath语法详解


Posted in Python onMarch 06, 2020

xml.etree.ElementTree可以通过支持的有限的XPath表达式来定位元素。

语法

ElementTree支持的语法如下:

语法 说明
tag 查找所有具有指定名称tag的子元素。例如:country表示所有名为country的元素,country/rank表示所有名为country的元素下名为rank的元素。
* 查找所有元素。如:*/rank表示所有名为rank的孙子元素。
. 选择当前元素。在xpath表达式开头使用,表示相对路径。
// 选择当前元素下所有级别的所有子元素。xpath不能以“//”开头。
.. 选择父元素。如果视图达到起始元素的祖先,则返回None(或空列表)。起始元素为调用find(或findall)的元素。
[@attrib] 选择具有指定属性attrib的所有子元素。
[@attrib='value'] 选择指定属性attrib具有指定值value的元素,该值不能包含引号。
[tag] 选择所有具有名为tag的子元素的元素。
[.='text'] Python3.7+,选择元素(或其子元素)完整文本内容为指定的值text的元素。
[tag='text'] 选择元素(或其子元素)名为tag,完整文本内容为指定的值text的元素。
[position] 选择位于给定位置的所有元素,position可以是以1为起始的整数、表达式last()或相对于最后一个位置的位置(如:last()-1)

方括号表达式前面必须有标签名、星号或者其他方括号表达式。position前必须有一个标签名。

简单示例

#!/usr/bin/python
# -*- coding:utf-8 -*-
import os
import xml.etree.cElementTree as ET
xml_string="""<?xml version="1.0"?>
<data>
  <country name="Liechtenstein">
    <rank updated="yes">2</rank>
    <year>2008</year>
    <gdppc>141100</gdppc>
    <neighbor name="Austria" direction="E"/>
    <neighbor name="Switzerland" direction="W"/>
  </country>
  <country name="Singapore">
    <rank updated="yes">5</rank>
    <year>2011</year>
    <gdppc>59900</gdppc>
    <neighbor name="Malaysia" direction="N"/>
  </country>
  <country name="Panama">
    <rank updated="yes">69</rank>
    <year>2011</year>
    <gdppc>2011</gdppc>
    <neighbor name="Costa Rica" direction="W"/>
    <neighbor name="Colombia" direction="E"/>
  </country>
	<country name="Washington">
    <rank updated="yes">55</rank>
    <gdppc>13600</gdppc>
  </country>
</data>
"""
root=ET.fromstring(xml_string)
#查找data下所有名为country的元素
for country in root.findall("country"):
	print("name:"+country.get("name"))
	#查找country下所有名为year的元素
	year=country.find("./year")
	if year:
		print("year:"+year.text)
#查找名为neighbor的孙子元素
for neighbor in root.findall("*/neighbor"):
	print("neighbor:"+neighbor.get("name"))
#查找country下的所有子元素
for ele in root.findall("country//"):
	print(ele.tag)
#查找当前元素的父元素,结果为空
print(root.findall(".."))
#查找与名为rank的孙子元素同级的名为gdppc的元素
for gdppc in root.findall("*/rank/../gdppc"):
	print("gdppc:"+gdppc.text)
#查找data下所有具有name属性的子元素
for country in root.findall("*[@name]"):
	print(country.get("name"))
#查找neighbor下所有具有name属性的子元素
for neighbor in root.findall("country/*[@name]"):
	print(neighbor.get("name"))
#查找country下name属性值为Malaysia的子元素
print("direction:"+root.find("country/*[@name='Malaysia']").get("direction"))
#查找root下所有包含名为year的子元素的元素
for country in root.findall("*[year]"):
	print("name:"+country.get("name"))
#查找元素(或其子元素)文本内容为2011的元素(Python3.7+)
#print(len(root.findall("*[.='2011']")))
#查找元素(或其子元素)名为gdppc,文本内容为2011的元素
for ele in root.findall("*[gdppc='2011']"):
	print(ele.get("name"))
#查找第二个country元素
print(root.find("country[2]").get("name"))

补充知识:python lxml etree xpath定位

etree全称:ElementTree 元素树

用法:

import requests
from lxml import etree
response = requests.get('html')
res = etree.HTML(response.text)   #利用 etree.HTML 初始化网页内容
resp = res.xpath('//span[@class="green"]/text()')

以上这篇Python3 xml.etree.ElementTree支持的XPath语法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解在Python程序中自定义异常的方法
Oct 16 Python
python 接口_从协议到抽象基类详解
Aug 24 Python
Python实现求一个集合所有子集的示例
May 04 Python
python pyheatmap包绘制热力图
Nov 09 Python
Python随机生成身份证号码及校验功能
Dec 04 Python
详解Python中is和==的区别
Mar 21 Python
详解python-图像处理(映射变换)
Mar 22 Python
python使用flask与js进行前后台交互的例子
Jul 19 Python
python中的global关键字的使用方法
Aug 20 Python
如何解决django-celery启动后迅速关闭
Oct 16 Python
python时间序列数据转为timestamp格式的方法
Aug 03 Python
总结Python常用的魔法方法
May 25 Python
python GUI库图形界面开发之PyQt5布局控件QHBoxLayout详细使用方法与实例
Mar 06 #Python
Python yield的用法实例分析
Mar 06 #Python
用Python生成HTML表格的方法示例
Mar 06 #Python
使用Python第三方库pygame写个贪吃蛇小游戏
Mar 06 #Python
Python修改列表值问题解决方案
Mar 06 #Python
浅谈matplotlib.pyplot与axes的关系
Mar 06 #Python
python-xpath获取html文档的部分内容
Mar 06 #Python
You might like
详解PHP中websocket的使用方法
2016/09/15 PHP
JS解密入门 最终变量劫持
2008/06/25 Javascript
jQuery 位置插件
2008/12/25 Javascript
自定义右键属性覆盖浏览器默认右键行为实现代码
2013/02/02 Javascript
escape函数解决js中ajax传递中文出现乱码问题
2014/10/30 Javascript
5种处理js跨域问题方法汇总
2014/12/04 Javascript
浅谈Unicode与JavaScript的发展史
2015/01/19 Javascript
原生JS实现美图瀑布流布局赏析
2015/09/07 Javascript
日常收集整理的JavaScript常用函数方法
2015/12/10 Javascript
理解Javascript文件动态加载
2016/01/29 Javascript
JS加载iFrame出现空白问题的解决办法
2016/05/13 Javascript
JS 调用微信扫一扫功能
2016/12/22 Javascript
Node.js调用fs.renameSync报错(Error: EXDEV, cross-device link not permitted)
2017/12/27 Javascript
Vue的事件响应式进度条组件实例详解
2018/02/04 Javascript
vue 不使用select实现下拉框功能(推荐)
2018/05/17 Javascript
微信小程序可滑动月日历组件使用详解
2019/10/21 Javascript
TensorFlow.js 微信小程序插件开始支持模型缓存的方法
2020/02/21 Javascript
JavaScript实现打砖块游戏
2020/02/25 Javascript
vuex Module将 store 分割成模块的操作
2020/12/07 Vue.js
Vue实现点击当前行变色
2020/12/14 Vue.js
关于Python中空格字符串处理的技巧总结
2017/08/10 Python
浅谈dataframe中更改列属性的方法
2018/07/10 Python
python 装饰器功能与用法案例详解
2020/03/06 Python
Python中求对数方法总结
2020/03/10 Python
HTML5和CSS3实例教程总结(推荐)
2016/07/18 HTML / CSS
微软新西兰官方网站:Microsoft New Zealand
2018/08/17 全球购物
Nebula美国官网:便携式投影仪
2019/03/15 全球购物
5个HTML5的常用本地存储方式详解与介绍
2021/03/27 HTML / CSS
怎样写好创业计划书的内容
2014/02/06 职场文书
信息学院毕业生自荐信范文
2014/03/04 职场文书
2015年元旦活动总结
2014/05/09 职场文书
股东授权委托书范文
2014/09/13 职场文书
2014年党员加强作风建设思想汇报
2014/09/15 职场文书
学校领导班子对照检查材料
2014/09/24 职场文书
检察院院长群众路线教育实践活动个人整改措施
2014/10/04 职场文书
司机岗位职责范本
2015/04/10 职场文书