浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
pyramid配置session的方法教程
Nov 27 Python
Python2.x与Python3.x的区别
Jan 14 Python
Python3使用PyQt5制作简单的画板/手写板实例
Oct 19 Python
详解Django中间件的5种自定义方法
Jul 26 Python
python 判断参数为Nonetype类型或空的实例
Oct 30 Python
基于numpy中数组元素的切片复制方法
Nov 15 Python
12个步骤教你理解Python装饰器
Jul 01 Python
使用python爬取抖音视频列表信息
Jul 15 Python
Python 操作 ElasticSearch的完整代码
Aug 04 Python
Python字典生成式、集合生成式、生成器用法实例分析
Jan 07 Python
python和JavaScript哪个容易上手
Jun 23 Python
python实现简单文件读写函数
Feb 25 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
PHP操作文件类的函数代码(文件和文件夹创建,复制,移动和删除)
2011/11/10 PHP
php随机显示指定文件夹下图片的方法
2015/07/13 PHP
Thinkphp 框架基础之入口文件功能、定义与用法分析
2020/04/27 PHP
ie focus bug 解决方法
2009/09/03 Javascript
jquery ajax 检测用户注册时用户名是否存在
2009/11/03 Javascript
FileUpload上传图片(图片不变形)
2010/08/05 Javascript
JavaScript中property和attribute的区别详细介绍
2015/03/03 Javascript
javascript等号运算符使用详解
2015/04/16 Javascript
JavaScript实现的SHA-1加密算法完整实例
2016/02/02 Javascript
微信小程序 window_x64环境搭建
2016/09/30 Javascript
Javascript实现数组中的元素上下移动
2017/04/28 Javascript
利用JS判断客户端类型你应该知道的四种方法
2017/12/22 Javascript
使用npm安装最新版本nodejs
2018/01/18 NodeJs
vue 循环加载数据并获取第一条记录的方法
2018/09/26 Javascript
Vue keepAlive 数据缓存工具实现返回上一个页面浏览的位置
2019/05/10 Javascript
Vue项目打包部署到iis服务器的配置方法
2019/10/14 Javascript
如何使用Javascript中的this关键字
2020/05/28 Javascript
[04:07]显微镜下的DOTA2第八期——英雄复活动作
2014/06/24 DOTA
python常用web框架简单性能测试结果分享(包含django、flask、bottle、tornado)
2014/08/25 Python
Python实现批量检测HTTP服务的状态
2016/10/27 Python
在python下实现word2vec词向量训练与加载实例
2020/06/09 Python
Python使用pycharm导入pymysql教程
2020/09/16 Python
中国最大的团购网站:聚划算
2016/09/21 全球购物
Joe Fresh官网:加拿大时尚品牌和零售连锁店
2016/11/30 全球购物
Space NK美国站:英国高端美妆护肤商城
2017/05/22 全球购物
西班牙购买隐形眼镜、眼镜和太阳镜网站:Lentiamo.es
2020/06/11 全球购物
客服端调用EJB对象的几个基本步骤
2012/01/15 面试题
简单而又朴实的个人求职信分享
2013/12/12 职场文书
银行服务明星推荐材料
2014/05/29 职场文书
社区服务活动小结
2014/07/08 职场文书
创先争优演讲稿
2014/09/15 职场文书
2015年大学生入党自荐书
2015/03/24 职场文书
物业前台接待岗位职责
2015/04/03 职场文书
2016年五四青年节校园广播稿
2015/12/17 职场文书
安全学习心得体会范文
2016/01/18 职场文书
Win11无法访问设备和打印机 如何解决页面空白
2022/04/09 数码科技