Python lxml解析HTML并用xpath获取元素的方法


Posted in Python onJanuary 02, 2019

代码

使用方法见注释

#-*- coding: UTF-8 -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="1">测试数据1</p>
<p class="p1" data-a="2">测试数据2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
图片</p>
'''

# 从字符串解析
page = etree.HTML(source)

# 元素列表
ps = page.xpath("//p")
for p in ps:
  print u"属性:%s" % p.attrib
  print u"文本:%s" % p.text

# 文本列表
ts = page.xpath("//p/text()")
for t in ts:
  print t

# xpath定位 
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的赋值、浅拷贝、深拷贝介绍
Mar 09 Python
python删除列表中重复记录的方法
Apr 28 Python
浅析Python中的赋值和深浅拷贝
Aug 15 Python
Python socket实现的简单通信功能示例
Aug 21 Python
Python中xml和json格式相互转换操作示例
Dec 05 Python
Python numpy中矩阵的基本用法汇总
Feb 12 Python
用Python实现校园通知更新提醒功能
Nov 23 Python
python将时分秒转换成秒的实例
Dec 07 Python
python logging添加filter教程
Dec 24 Python
python json.dumps() json.dump()的区别详解
Jul 14 Python
用ldap作为django后端用户登录验证的实现
Dec 07 Python
用Python爬取某乎手机APP数据
Jun 15 Python
用xpath获取指定标签下的所有text的实例
Jan 02 #Python
在python中获取div的文本内容并和想定结果进行对比详解
Jan 02 #Python
python的xpath获取div标签内html内容,实现innerhtml功能的方法
Jan 02 #Python
python后端接收前端回传的文件方法
Jan 02 #Python
python requests.post带head和body的实例
Jan 02 #Python
python批量获取html内body内容的实例
Jan 02 #Python
如何在django里上传csv文件并进行入库处理的方法
Jan 02 #Python
You might like
PHP set_time_limit(0)长连接的实现分析
2010/03/02 PHP
微信支付开发发货通知实例
2016/07/12 PHP
PHP版微信小店接口开发实例
2016/11/12 PHP
Firefox+FireBug使JQuery的学习更加轻松愉快
2010/01/01 Javascript
Asp.net下使用Jquery Ajax传送和接收DataTable的代码
2010/09/12 Javascript
对象无length属性时IE6/IE7中无法将其转换成伪数组(ArrayLike)
2011/07/31 Javascript
解析John Resig Simple JavaScript Inheritance代码
2012/12/03 Javascript
jquery图片不完全按比例自动缩小的简单代码
2013/07/29 Javascript
html5的自定义data-*属性和jquery的data()方法的使用示例
2013/08/21 Javascript
JQuery中模拟image的ajaxPrefilter与ajaxTransport处理
2015/06/19 Javascript
jquery实现滑动特效代码
2015/08/10 Javascript
jQuery简单设置文本框回车事件的方法
2016/08/01 Javascript
浅谈Angular.js中使用$watch监听模型变化
2017/01/10 Javascript
TypeScript入门-基本数据类型
2017/03/28 Javascript
详解webpack-dev-server 设置反向代理解决跨域问题
2018/04/18 Javascript
vue 监听键盘回车事件详解 @keyup.enter || @keyup.enter.native
2018/08/25 Javascript
详解JavaScript作用域和作用域链
2019/03/19 Javascript
Python装饰器用法实例总结
2018/05/26 Python
Django admin组件的使用
2020/10/24 Python
详解Pycharm第三方库的安装及使用方法
2020/12/29 Python
HTML5 FormData 方法介绍以及实现文件上传示例
2017/09/12 HTML / CSS
中国跨境在线时尚零售商:Bellelily
2018/04/06 全球购物
杰夫·班克斯男士服装网上商店:Jeff Banks
2019/10/24 全球购物
湖南卫视在线视频媒体平台:芒果TV
2019/10/30 全球购物
工程造价与财务管理专业应届生求职信
2013/10/06 职场文书
求职信范文怎么写
2014/01/29 职场文书
市优秀教师事迹材料
2014/02/05 职场文书
教师个人自我鉴定
2014/02/08 职场文书
《雷雨》教学反思
2014/02/20 职场文书
创业女性典型材料
2014/05/02 职场文书
2015年党风廉政建设工作总结
2015/04/09 职场文书
营运督导岗位职责
2015/04/10 职场文书
销售人员管理制度
2015/08/06 职场文书
2016应届毕业生实习心得体会
2015/10/09 职场文书
python实现socket简单通信的示例代码
2021/04/13 Python
Python Socket编程详解
2021/04/25 Python