浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python列表推导式的使用方法
Nov 21 Python
用Python制作简单的朴素基数估计器的教程
Apr 01 Python
Python实现获取照片拍摄日期并重命名的方法
Sep 30 Python
使用Python来开发微信功能
Jun 13 Python
Python随机生成身份证号码及校验功能
Dec 04 Python
python控制nao机器人身体动作实例详解
Apr 29 Python
python从入门到精通 windows安装python图文教程
May 18 Python
Python变量访问权限控制详解
Jun 29 Python
python实现网站用户名密码自动登录功能
Aug 09 Python
获取Pytorch中间某一层权重或者特征的例子
Aug 17 Python
python+playwright微软自动化工具的使用
Feb 02 Python
Pygame如何使用精灵和碰撞检测
Nov 17 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
PHP 的 __FILE__ 常量
2007/01/15 PHP
PHP数字字符串左侧补0、字符串填充和自动补齐的几种方法
2014/05/10 PHP
用javascript连接access数据库的方法
2006/11/17 Javascript
JavaScript prototype对象的属性说明
2010/03/13 Javascript
Javascript中的异步编程规范Promises/A详细介绍
2014/06/06 Javascript
Blocksit插件实现瀑布流数据无限( 异步)加载
2014/06/20 Javascript
js控制li的隐藏和显示实例代码
2016/10/15 Javascript
JS基于面向对象实现的选项卡效果示例
2016/12/20 Javascript
javascript添加前置0(补零)的几种方法
2017/01/05 Javascript
提高Web性能的前端优化技巧总结
2017/02/27 Javascript
jQuery Jsonp跨域模拟搜索引擎
2017/06/17 jQuery
基于vue1和vue2获取dom元素的方法
2018/03/17 Javascript
vue 自定义提示框(Toast)组件的实现代码
2018/08/17 Javascript
简单的React SSR服务器渲染实现
2018/12/11 Javascript
Flutter 超实用简单菜单弹出框 PopupMenuButton功能
2019/08/06 Javascript
详解nuxt 微信公众号支付遇到的问题与解决
2019/08/26 Javascript
VUE实现自身整体组件销毁的示例代码
2020/01/13 Javascript
JS Web Flex弹性盒子模型代码实例
2020/03/10 Javascript
[01:09]2014DOTA2国际邀请赛 TI4西雅图DOTA2 中国美女coser加油助威
2014/07/20 DOTA
python中urlparse模块介绍与使用示例
2017/11/19 Python
Python装饰器限制函数运行时间超时则退出执行
2019/04/09 Python
CSS3弹性盒模型开发笔记(三)
2016/04/26 HTML / CSS
你不知道的5个HTML5新功能
2016/06/28 HTML / CSS
法国综合购物网站:RueDuCommerce
2016/09/12 全球购物
世界领先的电子书网站:eBooks.com(在线购买小说、非小说和教科书)
2019/03/30 全球购物
如何现实servlet的单线程模式
2014/08/05 面试题
会计电算化专业个人的自我评价
2013/11/24 职场文书
交通事故赔偿协议书范本
2014/04/15 职场文书
电子信息专业应届生自荐信
2014/06/04 职场文书
银行反四风对照检查材料
2014/09/29 职场文书
幼儿教师2014年度工作总结
2014/12/16 职场文书
领导干部学习十八届五中全会精神心得体会
2016/01/05 职场文书
用人单位的规章制度,怎样制定才是有效的?
2019/07/09 职场文书
人生哲理妙语30条:淡写流年,笑过人生
2019/09/04 职场文书
JavaScript实现酷炫的鼠标拖尾特效
2022/02/18 Javascript
【海涛教你打DOTA】黑鸟第一视角解说
2022/04/01 DOTA