浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python发送邮件接收邮件示例分享
Jan 21 Python
python 文件操作删除某行的实例
Sep 04 Python
Python中getpass模块无回显输入源码解析
Jan 11 Python
Django urls.py重构及参数传递详解
Jul 23 Python
Python银行系统实战源码
Oct 25 Python
Ranorex通过Python将报告发送到邮箱的方法
Jan 12 Python
Python基于yield遍历多个可迭代对象
Mar 12 Python
Python求凸包及多边形面积教程
Apr 12 Python
Python3.8安装Pygame教程步骤详解
Aug 14 Python
anaconda3安装及jupyter环境配置全教程
Aug 24 Python
Pycharm配置autopep8实现流程解析
Nov 28 Python
基于python+selenium自动健康打卡的实现代码
Jan 13 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
php获取远程图片体积大小的实例
2013/11/12 PHP
ThinkPHP模板判断输出Present标签用法详解
2014/06/30 PHP
php中异常处理方法小结
2015/01/09 PHP
PHP实现简单实用的分页类代码
2016/04/08 PHP
ThinkPHP5.1框架页面跳转及修改跳转页面模版示例
2019/05/06 PHP
laravel 获取某个查询的查询SQL语句方法
2019/10/12 PHP
laravel使用数据库测试注意事项
2020/04/10 PHP
JavaScript 应用类库代码
2008/06/02 Javascript
JavaScript中“+”的陷阱深刻理解
2012/12/04 Javascript
JQuery异步获取返回值中文乱码的解决方法
2015/01/29 Javascript
js实现同一页面可多次调用的图片幻灯切换效果
2015/02/28 Javascript
轻松使用jQuery双向select控件Bootstrap Dual Listbox
2015/12/13 Javascript
实例解析js中try、catch、finally的执行规则
2017/02/24 Javascript
xmlplus组件设计系列之树(Tree)(9)
2017/05/02 Javascript
jquery ajax异步提交表单数据的方法
2017/10/27 jQuery
vue打包后显示空白正确处理方法
2017/11/01 Javascript
javaScript实现一个队列的方法
2020/07/14 Javascript
[54:06]OG vs TNC 2018国际邀请赛小组赛BO2 第二场 8.19
2018/08/21 DOTA
使用Python的Twisted框架编写非阻塞程序的代码示例
2016/05/25 Python
python 读写txt文件 json文件的实现方法
2016/10/22 Python
python通过pip更新所有已安装的包实现方法
2017/05/19 Python
python进程管理工具supervisor的安装与使用教程
2017/09/05 Python
Python3.6简单操作Mysql数据库
2017/09/12 Python
python实现的config文件读写功能示例
2019/09/24 Python
Django将默认的SQLite更换为MySQL的实现
2019/11/18 Python
Python爬虫如何应对Cloudflare邮箱加密
2020/06/24 Python
Python descriptor(描述符)的实现
2020/11/15 Python
美国新蛋IT数码商城:Newegg.com
2016/07/21 全球购物
世界上最大的街头服饰网站:Karmaloop
2017/02/04 全球购物
What's the difference between Debug and Trace class? (Debug类与Trace类有什么区别)
2013/09/10 面试题
表扬信格式
2014/01/12 职场文书
花坛标语大全
2014/06/30 职场文书
代办社保委托书范文
2014/10/06 职场文书
反腐倡廉主题教育活动总结
2015/05/07 职场文书
2015年小学实验室工作总结
2015/07/28 职场文书
php TP5框架生成二维码链接
2021/04/01 PHP