python xpath获取页面注释的方法


Posted in Python onJanuary 14, 2019

版本信息:

python 2.7.12

lxml 3.8.0

from lxml import etree
 
html_str = """
<div id="box1">this from blog.csdn.net/lncxydjq , DO NOT COPY!
  <div id="box2">*****
    <!--can u get me, bitch?-->
  </div>
</div>
"""
 
html = etree.HTML(html_str)
 
print html.xpath('//div[@id="box1"]/div/node()')[1]
print type(html.xpath('//div[@id="box1"]/div/node()')[1])
print html.xpath('//div[@id="box1"]/div/node()')[1].text
 
"""output:
<!--can u get me, bitch?-->
<type 'lxml.etree._Comment'>
can u get me, bitch?
"""

以上这篇python xpath获取页面注释的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用IronPython把Python脚本集成到.NET程序中的教程
Mar 31 Python
python获取指定时间差的时间实例详解
Apr 11 Python
用python做一个搜索引擎(Pylucene)的实例代码
Jul 05 Python
python实现图片批量压缩程序
Jul 23 Python
tensorflow 加载部分变量的实例讲解
Jul 27 Python
python opencv 读取本地视频文件 修改ffmpeg的方法
Jan 26 Python
Python 过滤错误log并导出的实例
Dec 26 Python
春节到了 教你使用python来抢票回家
Jan 06 Python
Python3+RIDE+RobotFramework自动化测试框架搭建过程详解
Sep 23 Python
python中实现词云图的示例
Dec 19 Python
用Python进行栅格数据的分区统计和批量提取
May 27 Python
python读取mat文件生成h5文件的实现
Jul 15 Python
Python面向对象之类的定义与继承用法示例
Jan 14 #Python
Python读取csv文件分隔符设置方法
Jan 14 #Python
Python装饰器用法实例分析
Jan 14 #Python
浅谈python str.format与制表符\t关于中文对齐的细节问题
Jan 14 #Python
对Python中创建进程的两种方式以及进程池详解
Jan 14 #Python
对Python多线程读写文件加锁的实例详解
Jan 14 #Python
Python多进程写入同一文件的方法
Jan 14 #Python
You might like
Java和PHP在Web开发方面对比分析
2015/03/01 PHP
NodeJS与Mysql的交互示例代码
2013/08/18 NodeJs
Jquery 的outerHeight方法使用介绍
2013/09/11 Javascript
整理的比较全的event对像在ie与firefox浏览器中的区别
2013/11/25 Javascript
jquery操作cookie插件分享
2014/01/14 Javascript
使用jQuery获得内容以及内容的属性
2015/02/26 Javascript
js判断上传文件后缀名是否合法
2016/01/28 Javascript
使用getBoundingClientRect方法实现简洁的sticky组件的方法
2016/03/22 Javascript
Vuejs第十一篇组件之slot内容分发实例详解
2016/09/09 Javascript
Bootstrap企业网站实战项目4
2016/10/14 Javascript
JavaScript生成简单等差数列
2017/11/28 Javascript
浅谈让你的代码更简短,更整洁,更易读的ES6小技巧
2018/10/25 Javascript
微信小程序的注册页面包含倒计时验证码、获取用户信息
2019/05/22 Javascript
JS实现字体背景跑马灯
2020/01/06 Javascript
javascript运行机制之执行顺序理解
2020/08/03 Javascript
[01:34]DOTA2 7.22版本新增神杖效果一览(敏捷英雄篇)
2019/05/28 DOTA
使用Python保存网页上的图片或者保存页面为截图
2016/03/05 Python
Python3学习urllib的使用方法示例
2017/11/29 Python
python中将zip压缩包转为gz.tar的方法
2018/10/18 Python
Jacobi迭代算法的Python实现详解
2019/06/29 Python
flask 实现token机制的示例代码
2019/11/07 Python
Python爬虫解析网页的4种方式实例及原理解析
2019/12/30 Python
Python使用enumerate获取迭代元素下标
2020/02/03 Python
Python ellipsis 的用法详解
2020/11/20 Python
CSS3中各种颜色属性的使用教程
2016/05/17 HTML / CSS
Deux par Deux官方网站:设计师童装
2020/01/03 全球购物
size?荷兰官方网站:英国高级运动鞋精品店
2020/07/24 全球购物
艾滋病宣传活动总结
2014/05/08 职场文书
七一党日活动总结
2014/07/08 职场文书
小学生一分钟演讲稿
2014/08/26 职场文书
关键在于落实心得体会
2014/09/03 职场文书
甲乙双方合作协议书
2014/10/13 职场文书
国际贸易实训报告
2014/11/05 职场文书
2014年信息中心工作总结
2014/12/17 职场文书
MySQL常见优化方案汇总
2022/01/18 MySQL
Java 中的 Lambda List 转 Map 的多种方法详解
2022/07/07 Java/Android