浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
浅析python实现scrapy定时执行爬虫
Mar 04 Python
Python可变参数*args和**kwargs用法实例小结
Apr 27 Python
在Python中os.fork()产生子进程的例子
Aug 08 Python
django实现用户注册实例讲解
Oct 30 Python
基于h5py的使用及数据封装代码
Dec 26 Python
python全局变量引用与修改过程解析
Jan 07 Python
Pytorch基本变量类型FloatTensor与Variable用法
Jan 08 Python
python 两个一样的字符串用==结果为false问题的解决
Mar 12 Python
pandas DataFrame运算的实现
Jun 14 Python
python如何输出反斜杠
Jun 18 Python
python文件路径操作方法总结
Dec 21 Python
python如何实现递归转非递归
Feb 25 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
用PHP生成静态HTML速度快类库
2007/03/18 PHP
php miniBB中文乱码问题解决方法
2008/11/25 PHP
PHP的substr_replace将指定两位置之间的字符替换为*号
2011/05/04 PHP
php遍历文件夹所有文件子文件夹函数代码
2013/11/27 PHP
php中explode函数用法分析
2014/11/15 PHP
php计算两个整数的最大公约数常用算法小结
2015/03/05 PHP
JS 容错处理代码, 屏蔽错误信息
2021/03/09 Javascript
JavaScript数据库TaffyDB用法实例分析
2015/07/27 Javascript
使用NodeJs 开发微信公众号(三)微信事件交互实例
2016/03/02 NodeJs
JavaScript仿flash遮罩动画效果
2016/06/15 Javascript
vue动画—通过钩子函数实现半场动画操作
2020/08/09 Javascript
vue前端和Django后端如何查询一定时间段内的数据
2021/02/28 Vue.js
python实现简易版计算器
2020/06/22 Python
Python线性回归实战分析
2018/02/01 Python
django将图片上传数据库后在前端显式的方法
2018/05/25 Python
Python列表生成式与生成器操作示例
2018/08/01 Python
python 获取utc时间转化为本地时间的方法
2018/12/31 Python
Django处理Ajax发送的Get请求代码详解
2019/07/29 Python
python图的深度优先和广度优先算法实例分析
2019/10/26 Python
使用Pandas的Series方法绘制图像教程
2019/12/04 Python
Python使用Tkinter实现滚动抽奖器效果
2020/01/06 Python
python3实现raspberry pi(树莓派)4驱小车控制程序
2020/02/12 Python
利用python 读写csv文件
2020/09/10 Python
CSS3动画效果回调处理详解
2014/12/10 HTML / CSS
比利时买床:Beter Bed
2017/12/06 全球购物
FLOS美国官网:意大利高级照明工艺的传奇
2018/08/07 全球购物
日本最大化妆品和美容产品的综合口碑网站:cosme shopping
2019/08/28 全球购物
介绍一下Python下range()函数的用法
2013/11/07 面试题
农民致富事迹材料
2014/01/23 职场文书
小学教师办公室制度
2014/02/03 职场文书
群众路线教育实践活动对照检查材料
2014/09/22 职场文书
法制教育观后感
2015/06/17 职场文书
红色经典电影观后感
2015/06/18 职场文书
小学中队委竞选稿
2015/11/20 职场文书
图解排序算法之希尔排序Java实现
2021/06/26 Java/Android
Pygame Event事件模块的详细示例
2021/11/17 Python