python正则表达式 匹配反斜杠的操作方法


Posted in Python onAugust 07, 2020

python正则表达式 匹配反斜杠

正则 需要把原始字符串不被转义的条件下传递给正则模块,正则再去转义。
r表示r后面的字符串为原始字符串,防止计算机将 \ 理解为转义字符。
r'^\\$' 首先按照原始字符串给到compile函数 ,正则再把r'^\\$'中的\`翻译成\

backslash='\\'
print(backslash)
regular_backslash=re.compile(r'^\\$')
print(regular_backslash.search(regular_backslash)

金额5.00中的 . 要使用 \.来匹配 。因为正则中.匹配可以所有的字符, 需要\.表示点。

import re
#匹配日期
date_regular = re.compile(r'^(\d{4})-(\d{2})-(\d{2})$')
print(date_regular.search('2017-33-12'))

#匹配金额 比如 5 5.00等金额 
money_regular = re.compile(r'^(\d{1,})\.(\d{1,})$|^(\d{1,})$')
print(money_regular.match('5.8'))

#匹配纯数字
number_regular = re.compile(r'^\d{1,}$')
print(number_regular.search('5'))

PS:下面看下Python字符串和正则表达式中的反斜杠(‘\‘)问题

在Python普通字符串中

在Python中,我们用''来转义某些普通字符,使其成为特殊字符,比如

In [1]: print('abc\ndef') # '\n'具有换行的作用
abc
defg

In [2]: print('abc\tdef') # '\t'具有制位符的作用      
abc defg

我们还可以用''来转义特殊字符,使其成为普通字符,比如

In [3]: print('abc\\tdef') # 使'\'成为一个普通的字符,没有转义作用
abc\tdef

In [4]: print('abc\'tdef') # 使'''成为一个普通的字符,不再需要和另一半单引号'''配对       
abc'tde

所以,在python普通字符串中,我们不能以奇数个''结尾,这样会导致结束的的引号转义成一个纯字符,从而使得这段字符串没有引号来结束。

在Python原生字符串中

我们在字符串前加一个'r'来表示原生字符串,比如r'abc'。原生字符串中的特殊字符的特殊含义将会被剥夺掉,如下

In [5]: print(r'abc\ndefg') # '\n'没有换行的作用,仅仅是一个普通的字符串       
abc\ndefg

In [6]: print(r'abc\tdefg') # '\t'没有制位符的作用,仅仅是一个普通的字符串     
abc\tdef

这里有一个奇怪的问题,在原生字符串中,虽然''成为了一个普通的字符串,但我们同样不能以奇数个''字符串结尾,这是因为Python正则表达式的原因,在正则表达式中我们将会解释这个问题。

在Python(regular express)正则表达式中

Python正则表达式中会有一些不同,正则表达式中指定了一些元字符(metacharacter),如下. ^ $ * + ? { } [ ] \ | ( )
它们都具有特殊的含义,''也属于元字符。''既属于Python中的特殊字符,也属于正则中的元字符,所以使用时得非常小心。那么在正则中,''的作用是什么呢?我们看一个例子

In [7]: re.search('.', 'sd.f')        
Out[7]: <_sre.SRE_Match object; span=(0, 1), match='s'>

In [8]: re.search('\.', 'sd.f')       
Out[8]: <_sre.SRE_Match object; span=(2, 3), match='.'>In [9]: re.search('\n', 'sdfd\nfds')      Out[9]: <_sre.SRE_Match object; span=(4, 5), match='\n'>

"""
'.'作为一个元字符,它的特殊含义是匹配任意一个字符,
而当我们在其前面加'\'后,它的特殊含义消失了,匹配到的是'.';
而且'\'依然可以把Python中某些字符转义成特殊字符。
"""

所以,''的作用是剥夺元字符的特殊含义,使其成为一个Python字符,所以它还是会具有在Python普通字符串中的转义作用,比如'\n'依然表示换行。所以,''既是正则中的一个元字符,又是Python中的一个特殊字符。那么我们该如何匹配到纯字符''(无任何特殊意义)?

在正则中,''的作用是把元字符转义成Python字符串文字(a Python string literal),所以正则中的'\'其实是其实是Python字符中的'',它仍然还具有转义作用,所以在正则中我们还得对每个''再进行转义一次,即'\\',这样就可以匹配到纯字符''了。看下面例子

In [10]: re.search('\\\\', 'fsd\nfds') # 目标字符串中没有纯字符'\',所以匹配为空

In [11]: re.search('\\\\', 'fsd\\nfds')           
Out[11]: <_sre.SRE_Match object; span=(3, 4), match='\\'> # Python字符串中,'\\'就是纯字符'\'

在re中反复的使用'',这可能会生成大量的连续的反斜杠,从而导致某些字符串难以理解。解决的办法是用Python原生字符串来书写正则表达式,如下

In [12]: re.search(r'\\', 'fsd\\nfds') # 两个'\\'就可以匹配到纯字符'\'
Out[12]: <_sre.SRE_Match object; span=(3, 4), match='\\'>

另外,当我们用原生字符串来书写正则表达式时,Python字符中的特殊字符依然有效,比如

In [13]: re.search(r'\n', 'fsd\nfds')           
Out[13]: <_sre.SRE_Match object; span=(3, 4), match='\n'>
"""
在Python字符中,r'\n'仅仅表示纯字符串'\n',没有换行的作用;
在正则中,r'\n'依然还有换行的作用。
所以此时我们不能用奇数个'\'来结尾某个正则表达式,这样导致结束的引号被转义成一个纯字符,无结束符号。
所以,在Python原生字符串中,我们也同样规定不能用奇数个'\'来结尾。
"""

总结

到此这篇关于Python字符串和正则表达式中的反斜杠(‘\‘)问题的文章就介绍到这了,更多相关Python字符串和正则表达式中的反斜杠(‘\‘)问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现可将字符转换成大写的tcp服务器实例
Apr 29 Python
Python抓取电影天堂电影信息的代码
Apr 07 Python
Python批量更改文件名的实现方法
Oct 29 Python
基于anaconda下强大的conda命令介绍
Jun 11 Python
python 多线程将大文件分开下载后在合并的实例
Nov 09 Python
pygame游戏之旅 计算游戏中躲过的障碍数量
Nov 20 Python
深入浅析Python2.x和3.x版本的主要区别
Nov 30 Python
Python中Selenium模块的使用详解
Oct 09 Python
pycharm激活码2020最新分享适用pycharm2020最新版亲测可用
Nov 22 Python
python中二分查找法的实现方法
Dec 06 Python
MATLAB 如何求取离散点的曲率最大值
Apr 16 Python
Django中celery的使用项目实例
Jul 07 Python
Pygame框架实现飞机大战
Aug 07 #Python
python爬取网易云音乐热歌榜实例代码
Aug 07 #Python
Python变量格式化输出实现原理解析
Aug 06 #Python
Python实现Canny及Hough算法代码实例解析
Aug 06 #Python
vscode调试django项目的方法
Aug 06 #Python
Python如何使用input函数获取输入
Aug 06 #Python
Python map及filter函数使用方法解析
Aug 06 #Python
You might like
Youku 视频绝对地址获取的方法详解
2013/06/26 PHP
PHP图片等比缩放类SimpleImage使用方法和使用实例分享
2014/04/10 PHP
php中rename函数用法分析
2014/11/15 PHP
使用JavaScript创建新样式表和新样式规则
2016/06/14 PHP
Laravel5.1 框架响应基本用法实例分析
2020/01/04 PHP
获取客户端电脑日期时间js代码(jquery)
2012/09/12 Javascript
比较新旧两个数组值得增加和删除的JS代码
2013/10/30 Javascript
自己动手写的jquery分页控件(非常简单实用)
2015/10/28 Javascript
jquery实现可旋转可拖拽的文字效果代码
2016/01/27 Javascript
jquery遍历table的tr获取td的值实现方法
2016/05/19 Javascript
功能强大的jquery.validate表单验证插件
2016/11/07 Javascript
微信小程序page的生命周期和音频播放及监听实例详解
2017/04/07 Javascript
JS Math对象与Math方法实例小结
2019/07/05 Javascript
jquery实现简单拖拽效果
2020/07/20 jQuery
jQuery实现容器间的元素拖拽功能
2020/12/01 jQuery
JS相册图片抖动放大展示效果的示例代码
2021/01/29 Javascript
微信跳一跳游戏python脚本
2020/04/01 Python
学习和使用python的13个理由
2019/07/30 Python
django API 中接口的互相调用实例
2020/04/01 Python
基于PyTorch的permute和reshape/view的区别介绍
2020/06/18 Python
Python 分布式缓存之Reids数据类型操作详解
2020/06/24 Python
python网络爬虫实现发送短信验证码的方法
2021/02/25 Python
HTML5 HTMLCollection和NodeList的区别详解
2020/04/29 HTML / CSS
DC Shoes俄罗斯官网:美国滑板鞋和服饰品牌
2020/08/19 全球购物
美国椅子和沙发制造商:La-Z-Boy
2020/10/25 全球购物
新闻专业应届生求职信
2013/10/31 职场文书
大学生军训自我鉴定
2014/02/12 职场文书
人事文员岗位职责
2014/02/16 职场文书
法律进机关实施方案
2014/03/12 职场文书
李敖北大演讲稿
2014/05/24 职场文书
环境科学专业求职信
2014/08/04 职场文书
2014年语文教研组工作总结
2014/12/06 职场文书
小学教师教学反思
2016/02/24 职场文书
2016年领导干部廉政承诺书
2016/03/24 职场文书
2019终止劳动合同协议书最新范本!
2019/07/09 职场文书
CSS的calc函数用法小结
2022/06/25 HTML / CSS