Python lxml库的简单介绍及基本使用讲解


Posted in Python onDecember 22, 2020

1.lxml库介绍

lxml是XML和HTML的解析器,其主要功能是解析和提取XML和HTML中的数据;lxml和正则一样,也是用C语言实现的,是一款高性能的python HTML、XML解析器,也可以利用XPath语法,来定位特定的元素及节点信息

HTML是超文本标记语言,主要用于显示数据,他的焦点是数据的外观
XML是可扩展标记语言,主要用于传输和存储数据,他的焦点是数据的内容

2.安装lxml方法

方法1:
在cmd运行窗口中输入:pip install lxml

Python lxml库的简单介绍及基本使用讲解

方法2:
在Pycharm中下载
File?Setting?Project?Project Interpreter?点击右上角的“+”—
第1步

Python lxml库的简单介绍及基本使用讲解

第2步

Python lxml库的简单介绍及基本使用讲解

第3步

Python lxml库的简单介绍及基本使用讲解

方法3:
进入这个网站进行下载:https://lxml.de/index.html

Python lxml库的简单介绍及基本使用讲解

3.基本使用

我们可以利用他解析HTML代码,并且在解析HTML代码的时候,如果HTML代码不规范或者不完整,lxml解析器会自动修复或补全代码,从而提高效率

实例1:
解析HTML代码块

#提取html中的数据
from lxml import etree

text = '''
<html>
    <div class="clearfix">
    <div class="nav_com">
     <ul>
       <li class="active"><a href="/" rel="external nofollow" >推荐</a></li>
       <li class=""><a href="/nav/python" rel="external nofollow" >Python</a></li>
       <li class=""><a href="/nav/java" rel="external nofollow" >Java</a></li>
       <li class=""><a href="/nav/web" rel="external nofollow" >前端</a></li>
       <li class=""><a href="/nav/arch" rel="external nofollow" >架构</a></li>
       <li class=""><a href="/nav/db" rel="external nofollow" >数据库</a></li>
       <li class=""><a href="/nav/5g" rel="external nofollow" >5G</a></li>
       <li class=""><a href="/nav/game" rel="external nofollow" >游戏开发</a></li>
       <li class=""><a href="/nav/mobile" rel="external nofollow" >移动开发</a></li>
       <li class=""><a href="/nav/ops" rel="external nofollow" >运维</a></li>
     </ul>
    </div>
    </div>
</html>>
</html>>

'''
#将字符串解析为html文档
html = etree.HTML(text)
#print(html)
#将字符串序列化为html
result = etree.tostring(html).decode('utf-8')
print(result)

实例2:
读取并解析html文件

#将html文件进行解析
from lxml import etree
#将html文件进行读取
html = etree.parse('data.html')
#将html内容序列化
result = etree.tostring(html).decode('utf-8')
print(result)

到此这篇关于Python lxml库的简单介绍及基本使用讲解的文章就介绍到这了,更多相关Python lxml库使用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
手动实现把python项目发布为exe可执行程序过程分享
Oct 23 Python
Python进阶_关于命名空间与作用域(详解)
May 29 Python
Python学习之用pygal画世界地图实例
Dec 07 Python
Pandas Shift函数的基础入门学习笔记
Nov 16 Python
python opencv读mp4视频的实例
Dec 07 Python
scrapy-redis的安装部署步骤讲解
Feb 27 Python
Python+OpenCV+pyQt5录制双目摄像头视频的实例
Jun 28 Python
Python 列表的清空方式
Jan 13 Python
Python实现鼠标自动在屏幕上随机移动功能
Mar 14 Python
浅谈numpy中np.array()与np.asarray的区别以及.tolist
Jun 03 Python
django下创建多个app并设置urls方法
Aug 02 Python
python生成word合同的实例方法
Jan 12 Python
Python中过滤字符串列表的方法
Dec 22 #Python
python中@property的作用和getter setter的解释
Dec 22 #Python
地图可视化神器kepler.gl python接口的使用方法
Dec 22 #Python
Python实现Word文档转换Markdown的示例
Dec 22 #Python
python爬虫利用selenium实现自动翻页爬取某鱼数据的思路详解
Dec 22 #Python
Django中ORM的基本使用教程
Dec 22 #Python
python通用数据库操作工具 pydbclib的使用简介
Dec 21 #Python
You might like
用PHP发电子邮件
2006/10/09 PHP
PHP 的ArrayAccess接口 像数组一样来访问你的PHP对象
2010/10/12 PHP
解析php中array_merge与array+array的区别
2013/06/21 PHP
codeigniter使用技巧批量插入数据实例方法分享
2013/12/31 PHP
10个超级有用的PHP代码片段果断收藏
2015/09/23 PHP
基于ThinkPHP实现批量删除
2015/12/18 PHP
PHP使用socket发送HTTP请求的方法
2016/02/14 PHP
在laravel中实现将查询的对象转换为多维数组的函数
2019/10/21 PHP
用倒置滤镜把div倒置,再把table倒置。
2007/07/31 Javascript
JavaScript下申明对象的几种方法小结
2008/10/02 Javascript
精心挑选的15款优秀jQuery 本特效插件和教程
2012/08/06 Javascript
如何通过javascript操作web控件的自定义属性
2013/11/25 Javascript
使用CSS样式position:fixed水平滚动的方法
2014/02/19 Javascript
解析javascript瀑布流原理实现图片滚动加载
2016/03/10 Javascript
Java  Spring 事务回滚详解
2016/10/17 Javascript
jquery实现点击a链接,跳转之后,该a链接处显示背景色的方法
2018/01/18 jQuery
详解angular部署到iis出现404解决方案
2018/08/14 Javascript
vue动画之点击按钮往上渐渐显示出来的实例
2018/09/29 Javascript
Javascript实现一朵从含苞到绽放的玫瑰
2019/03/30 Javascript
JQuery实现ul中添加LI和删除指定的Li元素功能完整示例
2019/10/16 jQuery
python连接池实现示例程序
2013/11/26 Python
python实现绘制树枝简单示例
2014/07/24 Python
python3实现ftp服务功能(客户端)
2017/03/24 Python
Pycharm 创建 Django admin 用户名和密码的实例
2018/05/30 Python
pygame实现雷电游戏雏形开发
2018/11/20 Python
对Python发送带header的http请求方法详解
2019/01/02 Python
python操作日志的封装方法(两种方法)
2019/05/23 Python
PyQt5下拉式复选框QComboCheckBox的实例
2019/06/25 Python
python中类与对象之间的关系详解
2020/12/16 Python
环保倡议书怎么写
2014/05/16 职场文书
冬季安全检查方案
2014/05/23 职场文书
孝老爱亲模范事迹材料
2014/05/25 职场文书
2015年国庆节活动总结
2015/03/23 职场文书
2015年企业员工工作总结范文
2015/05/21 职场文书
小学生暑假生活总结
2015/07/13 职场文书
合同补充协议书
2016/03/24 职场文书