浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python logging类库使用例子
Nov 22 Python
Python实现基于权重的随机数2种方法
Apr 28 Python
Python黑魔法Descriptor描述符的实例解析
Jun 02 Python
Django添加favicon.ico图标的示例代码
Aug 07 Python
python 在指定范围内随机生成不重复的n个数实例
Jan 28 Python
Python快速转换numpy数组中Nan和Inf的方法实例说明
Feb 21 Python
Django 框架模型操作入门教程
Nov 05 Python
python自动点赞功能的实现思路
Feb 26 Python
python中安装django模块的方法
Mar 12 Python
django序列化时使用外键的真实值操作
Jul 15 Python
Python利用Faiss库实现ANN近邻搜索的方法详解
Aug 03 Python
windows+vscode安装paddleOCR运行环境的步骤
Nov 11 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
使用迭代器 遍历文件信息的详解
2013/06/08 PHP
php导出csv格式数据并将数字转换成文本的思路以及代码分享
2014/06/05 PHP
php清空(删除)指定目录下的文件,不删除目录文件夹的实现代码
2014/09/04 PHP
PHP冒泡算法详解(递归实现)
2014/11/10 PHP
php实现改变图片直接打开为下载的方法
2015/04/14 PHP
PHP7数组的底层实现示例
2019/08/25 PHP
javascript 异步页面查询实现代码(asp.net)
2010/05/26 Javascript
input输入框的自动匹配(原生代码)
2013/03/19 Javascript
js购物车实现思路及代码(个人感觉不错)
2013/12/23 Javascript
JavaScript中switch判断容易犯错的一个细节
2014/08/27 Javascript
JavaScript之Object类型介绍
2015/04/01 Javascript
JS实现DIV容器赋值的方法
2015/12/14 Javascript
微信公众号菜单配置微信小程序实例详解
2017/03/31 Javascript
jQuery实现文章图片弹出放大效果
2017/04/06 jQuery
js+html制作简单日历的方法
2017/06/27 Javascript
在Vue项目中,防止页面被缩放和放大示例
2019/10/28 Javascript
js实现简单的秒表
2020/01/16 Javascript
使用Vant完成DatetimePicker 日期的选择器操作
2020/11/12 Javascript
Python过滤函数filter()使用自定义函数过滤序列实例
2014/08/26 Python
Python简单日志处理类分享
2015/02/14 Python
Python中MySQLdb和torndb模块对MySQL的断连问题处理
2015/11/09 Python
浅谈Python处理PDF的方法
2017/11/10 Python
使用matplotlib画散点图的方法
2018/05/25 Python
python抓取京东小米8手机配置信息
2018/11/13 Python
python 应用之Pycharm 新建模板默认添加编码格式-作者-时间等信息【推荐】
2019/06/17 Python
pandas 时间格式转换的实现
2019/07/06 Python
python监控进程状态,记录重启时间及进程号的实例
2019/07/15 Python
python opencv实现信用卡的数字识别
2020/01/12 Python
wxpython自定义下拉列表框过程图解
2020/02/14 Python
外贸实习生自荐信范文
2013/11/24 职场文书
银行优秀员工事迹
2014/02/06 职场文书
运动会通讯稿200字
2014/02/16 职场文书
领导班子四风查摆对照检查材料思想汇报
2014/10/05 职场文书
伊索寓言读书笔记
2015/06/30 职场文书
详解如何在Canvas中添加事件的方法
2021/04/17 Javascript
python运算符之与用户交互
2022/04/13 Python