Python lxml解析HTML并用xpath获取元素的方法


Posted in Python onJanuary 02, 2019

代码

使用方法见注释

#-*- coding: UTF-8 -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="1">测试数据1</p>
<p class="p1" data-a="2">测试数据2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
图片</p>
'''

# 从字符串解析
page = etree.HTML(source)

# 元素列表
ps = page.xpath("//p")
for p in ps:
  print u"属性:%s" % p.attrib
  print u"文本:%s" % p.text

# 文本列表
ts = page.xpath("//p/text()")
for t in ts:
  print t

# xpath定位 
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python里将list中元素依次向前移动一位
Sep 12 Python
Python类的专用方法实例分析
Jan 09 Python
python中OrderedDict的使用方法详解
May 05 Python
简单谈谈python中的语句和语法
Aug 10 Python
Python AES加密实例解析
Jan 18 Python
Django使用中间件解决前后端同源策略问题
Sep 02 Python
Pycharm 安装 idea VIM插件的图文教程详解
Feb 21 Python
Python 窗体(tkinter)下拉列表框(Combobox)实例
Mar 04 Python
QML用PathView实现轮播图
Jun 03 Python
解决Django响应JsonResponse返回json格式数据报错问题
Aug 09 Python
python学习之使用Matplotlib画实时的动态折线图的示例代码
Feb 25 Python
只用50行Python代码爬取网络美女高清图片
Jun 02 Python
用xpath获取指定标签下的所有text的实例
Jan 02 #Python
在python中获取div的文本内容并和想定结果进行对比详解
Jan 02 #Python
python的xpath获取div标签内html内容,实现innerhtml功能的方法
Jan 02 #Python
python后端接收前端回传的文件方法
Jan 02 #Python
python requests.post带head和body的实例
Jan 02 #Python
python批量获取html内body内容的实例
Jan 02 #Python
如何在django里上传csv文件并进行入库处理的方法
Jan 02 #Python
You might like
解析如何修改phpmyadmin中的默认登陆超时时间
2013/06/25 PHP
PHP图像识别技术原理与实现
2016/10/27 PHP
PHP编程实现微信企业向用户付款的方法示例
2017/07/26 PHP
支持汉转拼和拼音分词的PHP中文工具类ChineseUtil
2018/02/23 PHP
使用vs code编辑调试php配置的方法
2019/01/29 PHP
实例介绍PHP中zip_open()函数用法
2019/02/15 PHP
Laravel 手动开关 Eloquent 修改器的操作方法
2019/12/30 PHP
php设计模式之中介者模式分析【星际争霸游戏案例】
2020/03/23 PHP
Nigma vs Liquid BO3 第一场2.13
2021/03/10 DOTA
jQuery select操作控制方法小结
2010/05/26 Javascript
JS 修改URL参数(实现代码)
2013/07/08 Javascript
JavaScript DOM 编程艺术(第2版)读书笔记(JavaScript的最佳实践)
2013/10/01 Javascript
Js操作Select大全(取值、设置选中等等)
2013/10/29 Javascript
jquery实现向下滑出的二级导航下滑菜单效果
2015/08/25 Javascript
浅谈js基本数据类型和typeof
2016/08/09 Javascript
Angular 4依赖注入学习教程之InjectToken的使用(八)
2017/06/04 Javascript
jQuery简单实现向列表动态添加新元素的方法示例
2017/12/25 jQuery
vue2.0+SVG实现音乐播放圆形进度条组件
2019/09/21 Javascript
Vue前端项目部署IIS的实现
2020/01/06 Javascript
在Python中封装GObject模块进行图形化程序编程的教程
2015/04/14 Python
详解django三种文件下载方式
2018/04/06 Python
pycharm恢复默认设置或者是替换pycharm的解释器实例
2018/10/29 Python
python 多线程串行和并行的实例
2019/02/22 Python
pandas修改DataFrame列名的实现方法
2019/02/22 Python
python绘制彩虹图
2019/12/16 Python
pytorch实现线性拟合方式
2020/01/15 Python
Python制作简易版小工具之计算天数的实现思路
2020/02/13 Python
Selenium启动Chrome时配置选项详解
2020/03/18 Python
Python多进程编程常用方法解析
2020/03/26 Python
Python virtualenv虚拟环境实现过程解析
2020/04/18 Python
Casadei卡萨蒂官网:意大利奢侈鞋履品牌
2017/10/28 全球购物
品管员岗位职责
2013/11/10 职场文书
保安队长职务说明书
2014/02/23 职场文书
走进敬老院活动总结
2014/07/10 职场文书
运动会400米加油稿(8篇)
2014/09/22 职场文书
研究生导师推荐信
2015/03/25 职场文书