Python lxml解析HTML并用xpath获取元素的方法


Posted in Python onJanuary 02, 2019

代码

使用方法见注释

#-*- coding: UTF-8 -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="1">测试数据1</p>
<p class="p1" data-a="2">测试数据2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
图片</p>
'''

# 从字符串解析
page = etree.HTML(source)

# 元素列表
ps = page.xpath("//p")
for p in ps:
  print u"属性:%s" % p.attrib
  print u"文本:%s" % p.text

# 文本列表
ts = page.xpath("//p/text()")
for t in ts:
  print t

# xpath定位 
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
netbeans7安装python插件的方法图解
Dec 24 Python
python获取当前时间对应unix时间戳的方法
May 15 Python
Python ValueError: invalid literal for int() with base 10 实用解决方法
Jun 21 Python
python各种语言间时间的转化实现代码
Mar 23 Python
Python定时发送消息的脚本:每天跟你女朋友说晚安
Oct 21 Python
详解python中list的使用
Mar 15 Python
Python3.0中普通方法、类方法和静态方法的比较
May 03 Python
Django 模型类(models.py)的定义详解
Jul 19 Python
如何基于线程池提升request模块效率
Apr 18 Python
Python垃圾回收机制三种实现方法
Apr 27 Python
python中adb有什么功能
Jun 07 Python
在NumPy中深拷贝和浅拷贝相关操作的定义和背后的原理
Apr 14 Python
用xpath获取指定标签下的所有text的实例
Jan 02 #Python
在python中获取div的文本内容并和想定结果进行对比详解
Jan 02 #Python
python的xpath获取div标签内html内容,实现innerhtml功能的方法
Jan 02 #Python
python后端接收前端回传的文件方法
Jan 02 #Python
python requests.post带head和body的实例
Jan 02 #Python
python批量获取html内body内容的实例
Jan 02 #Python
如何在django里上传csv文件并进行入库处理的方法
Jan 02 #Python
You might like
PHP模板引擎SMARTY
2006/10/09 PHP
提升PHP速度全攻略
2006/10/09 PHP
PHP正确配置mysql(apache环境)
2011/08/28 PHP
php数值转换时间及时间转换数值用法示例
2017/05/18 PHP
PHP使用DOM对XML解析处理操作示例
2019/07/04 PHP
firefox中用javascript实现鼠标位置的定位
2007/06/17 Javascript
利用JS重写Cognos右键菜单的实现代码
2010/04/11 Javascript
原生js实现shift/ctrl/alt按键的获取
2013/04/08 Javascript
如何解决Jquery库及其他库之间的$命名冲突
2013/09/15 Javascript
jQuery实现页面内锚点平滑跳转特效的方法总结
2015/05/11 Javascript
jQuery实现类似标签风格的导航菜单效果代码
2015/08/25 Javascript
JavaScript中文件上传API详解
2016/04/01 Javascript
Javascript中的arguments对象
2016/06/20 Javascript
Angular 2 ngForm中的ngModel、[ngModel]和[(ngModel)]的写法
2017/06/29 Javascript
JS实现的抛物线运动效果示例
2018/01/30 Javascript
微信小程序自定义底部导航带跳转功能
2018/11/27 Javascript
微信小程序pinker组件使用实现自动相减日期
2020/05/07 Javascript
elementUI同一页面展示多个Dialog的实现
2020/11/19 Javascript
Python中的类学习笔记
2014/09/23 Python
Python向Excel中插入图片的简单实现方法
2018/04/24 Python
Python实现UDP程序通信过程图解
2020/05/15 Python
浅谈pandas dataframe对除数是零的处理
2020/07/20 Python
基于Python爬取股票数据过程详解
2020/10/21 Python
CSS3教程:background-clip和background-origin
2008/10/17 HTML / CSS
Jo Malone美国官网:祖玛珑香水
2017/03/27 全球购物
捷克购买家具网站:JENA nábytek
2020/03/19 全球购物
网络安全类面试题
2015/08/01 面试题
设计师求职信
2014/07/01 职场文书
行政专员岗位职责范本
2014/08/26 职场文书
2015年乡镇工作总结范文
2015/04/22 职场文书
学校禁毒宣传活动总结
2015/05/08 职场文书
JavaScript嵌入百度地图API的最详细方法
2021/04/16 Javascript
vue响应式原理与双向数据的深入解析
2021/06/04 Vue.js
基于HTML十秒做出淘宝页面
2021/10/24 HTML / CSS
nginx搭建NFS网络文件系统
2022/04/14 Servers
聊聊CSS粘性定位sticky案例解析
2022/06/01 HTML / CSS