浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之Hello World!
Aug 29 Python
跟老齐学Python之通过Python连接数据库
Oct 28 Python
Python读大数据txt
Mar 28 Python
JS设计模式之责任链模式实例详解
Feb 03 Python
实用自动化运维Python脚本分享
Jun 04 Python
Python django使用多进程连接mysql错误的解决方法
Oct 08 Python
用Pycharm实现鼠标滚轮控制字体大小的方法
Jan 15 Python
python中for in的用法详解
Apr 17 Python
Python中SQLite如何使用
May 27 Python
python中Ansible模块的Playbook的具体使用
May 28 Python
浅析python 字典嵌套
Sep 29 Python
Django-silk性能测试工具安装及使用解析
Nov 28 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
重置版战役片段
2020/04/09 魔兽争霸
php对数组排序代码分享
2014/02/24 PHP
PHP中file_get_contents高?用法实例
2014/09/24 PHP
Docker搭建自己的PHP开发环境
2018/02/24 PHP
thinkPHP框架实现多表查询的方法
2018/06/14 PHP
初窥JQuery(一)jquery选择符 必备知识点
2010/11/25 Javascript
Javascript在IE和FireFox中的不同表现简析
2012/12/03 Javascript
jQuery判断复选框是否勾选的原理及示例
2014/05/21 Javascript
JS制作简单的三级联动
2015/03/18 Javascript
jquery实现的省市区三级联动
2015/04/02 Javascript
JavaScript在网页中画圆的函数arc使用方法
2015/11/13 Javascript
Angularjs之filter过滤器(推荐)
2016/11/27 Javascript
js数组与字符串常用方法总结
2017/01/13 Javascript
如何写好一个vue组件,老夫的一年经验全在这了(推荐)
2019/05/18 Javascript
Vue利用Blob下载原生二进制数组文件
2019/09/25 Javascript
[15:23]教你分分钟做大人:虚空假面
2014/10/30 DOTA
python 实现文件的递归拷贝实现代码
2012/08/02 Python
python创建一个最简单http webserver服务器的方法
2015/05/08 Python
详解python使用Nginx和uWSGI来运行Python应用
2018/01/09 Python
django表单实现下拉框的示例讲解
2018/05/29 Python
python 利用pandas将arff文件转csv文件的方法
2019/02/12 Python
python 设置输出图像的像素大小方法
2019/07/04 Python
python gensim使用word2vec词向量处理中文语料的方法
2019/07/05 Python
python编写简单端口扫描器
2019/09/04 Python
Python函数参数定义及传递方式解析
2020/06/10 Python
No module named ‘win32gui‘ 的解决方法(踩坑之旅)
2021/02/18 Python
do you have any Best Practice for testing
2016/06/04 面试题
保安队长职务说明书
2014/02/23 职场文书
遗体告别仪式主持词
2014/03/20 职场文书
《三个小伙伴》教学反思
2014/04/11 职场文书
俞敏洪北大演讲稿
2014/05/22 职场文书
幼儿园综治宣传月活动总结
2015/05/07 职场文书
预备党员入党感想
2015/08/10 职场文书
SpringBoot+Redis实现布隆过滤器的示例代码
2022/03/17 Java/Android
java中为什么说子类的构造方法默认访问的是父类的无参构造方法
2022/04/13 Java/Android
Android中View.post和Handler.post的关系
2022/06/05 Java/Android