Python lxml解析HTML并用xpath获取元素的方法


Posted in Python onJanuary 02, 2019

代码

使用方法见注释

#-*- coding: UTF-8 -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="1">测试数据1</p>
<p class="p1" data-a="2">测试数据2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
图片</p>
'''

# 从字符串解析
page = etree.HTML(source)

# 元素列表
ps = page.xpath("//p")
for p in ps:
  print u"属性:%s" % p.attrib
  print u"文本:%s" % p.text

# 文本列表
ts = page.xpath("//p/text()")
for t in ts:
  print t

# xpath定位 
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python环境变量设置方法
Aug 28 Python
在 Python 应用中使用 MongoDB的方法
Jan 05 Python
Python3 replace()函数使用方法
Mar 19 Python
VSCode下好用的Python插件及配置
Apr 06 Python
基于Python中求和函数sum的用法详解
Jun 28 Python
关于Python中定制类的比较运算实例
Dec 19 Python
python爬虫开发之使用python爬虫库requests,urllib与今日头条搜索功能爬取搜索内容实例
Mar 10 Python
python获取命令行参数实例方法讲解
Nov 02 Python
python 基于opencv实现高斯平滑
Dec 18 Python
python+selenium自动化实战携带cookies模拟登陆微博
Jan 19 Python
关于Numpy之repeat、tile的用法总结
Jun 02 Python
Python包argparse模块常用方法
Jun 04 Python
用xpath获取指定标签下的所有text的实例
Jan 02 #Python
在python中获取div的文本内容并和想定结果进行对比详解
Jan 02 #Python
python的xpath获取div标签内html内容,实现innerhtml功能的方法
Jan 02 #Python
python后端接收前端回传的文件方法
Jan 02 #Python
python requests.post带head和body的实例
Jan 02 #Python
python批量获取html内body内容的实例
Jan 02 #Python
如何在django里上传csv文件并进行入库处理的方法
Jan 02 #Python
You might like
基于mysql的论坛(6)
2006/10/09 PHP
php+MySql实现登录系统与输出浏览者信息功能
2016/07/01 PHP
PHP实现链表的定义与反转功能示例
2018/06/09 PHP
php伪静态验证码不显示的解决方案
2019/09/26 PHP
一个判断email合法性的函数[非正则]
2008/12/09 Javascript
js 效率组装字符串 StringBuffer
2009/12/23 Javascript
六款帮助你实现惊艳视差滚动效果的jQuery插件
2012/09/14 Javascript
jQuery图片切换插件jquery.cycle.js使用示例
2014/06/16 Javascript
jQuery中eq()方法用法实例
2015/01/05 Javascript
jQuery实现预加载图片的方法
2015/03/17 Javascript
Jquery操作cookie记住用户名
2016/03/29 Javascript
json对象转为字符串,当做参数传递时加密解密的实现方法
2016/06/29 Javascript
JavaScript生成验证码并实现验证功能
2016/09/24 Javascript
JS常用加密编码与算法实例总结
2016/12/22 Javascript
jQuery命名空间与闭包用法示例
2017/01/12 Javascript
Bootstrap fileinput文件上传预览插件使用详解
2017/05/16 Javascript
jQuery异步提交表单实例
2017/05/30 jQuery
如何把vuejs打包出来的文件整合到springboot里
2018/07/26 Javascript
vue3.0中的双向数据绑定方法及优缺点
2019/08/01 Javascript
JS实现随机抽选获奖者
2019/11/07 Javascript
使用Vue 自定义文件选择器组件的实例代码
2020/03/04 Javascript
[01:12]快闪回顾DOTA2亚洲邀请赛(DAC) 静候2018新征程开启
2018/03/11 DOTA
python 简单的多线程链接实现代码
2016/08/28 Python
Python实现的桶排序算法示例
2017/11/29 Python
pytorch实现线性拟合方式
2020/01/15 Python
Python 实现二叉查找树的示例代码
2020/12/21 Python
html5 touch事件实现触屏页面上下滑动(二)
2016/03/10 HTML / CSS
浅谈HTML5 &amp; CSS3的新交互特性
2016/07/19 HTML / CSS
SmartBuyGlasses美国官网:太阳眼镜和眼镜
2017/08/20 全球购物
香港优质食材和美酒专门店:FoodWise
2017/09/01 全球购物
采用冷却技术的超自然舒适度:GhostBed床垫
2018/09/18 全球购物
迟到检讨书800字
2014/01/13 职场文书
走群众路线学习心得体会
2014/10/31 职场文书
语文教师个人工作总结
2015/02/06 职场文书
党员自我评价范文2015
2015/03/03 职场文书
安全教育培训心得体会
2016/01/15 职场文书