编程 Python

Python lxml解析HTML并用xpath获取元素的方法

Posted in Python onJanuary 02, 2019

代码

使用方法见注释

#-*- coding: UTF-8 -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="1">测试数据1</p>
<p class="p1" data-a="2">测试数据2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
图片</p>
'''

# 从字符串解析
page = etree.HTML(source)

# 元素列表
ps = page.xpath("//p")
for p in ps:
  print u"属性：%s" % p.attrib
  print u"文本：%s" % p.text

# 文本列表
ts = page.xpath("//p/text()")
for t in ts:
  print t

# xpath定位 
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Python lxml解析HTML并用xpath获取元素的方法

- Author -

lilongsy

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python使用urlparse分析网址中域名的方法

Apr 15 Python

python转换字符串为摩尔斯电码的方法

Jul 06 Python

Python实现基于多线程、多用户的FTP服务器与客户端功能完整实例

Aug 18 Python

Python排序搜索基本算法之归并排序实例分析

Dec 08 Python

Python实现手写一个类似django的web框架示例

Jul 20 Python

浅谈django的render函数的参数问题

Oct 16 Python

使用python批量读取word文档并整理关键信息到excel表格的实例

Nov 07 Python

在PyCharm中实现关闭一个死循环程序的方法

Nov 29 Python

python模块导入的细节详解

Dec 10 Python

Python爬虫实现“盗取”微信好友信息的方法分析

Sep 16 Python

Numpy之将矩阵拉成向量的实例

Nov 30 Python

python爬虫scrapy框架之增量式爬虫的示例代码

Feb 26 Python

用xpath获取指定标签下的所有text的实例

Jan 02 #Python

在python中获取div的文本内容并和想定结果进行对比详解

Jan 02 #Python

python的xpath获取div标签内html内容,实现innerhtml功能的方法

Jan 02 #Python

python后端接收前端回传的文件方法

Jan 02 #Python

python requests.post带head和body的实例

Jan 02 #Python

python批量获取html内body内容的实例

Jan 02 #Python

如何在django里上传csv文件并进行入库处理的方法

Jan 02 #Python