Python字符串和正则表达式中的反斜杠('\')问题详解


Posted in Python onSeptember 03, 2019

在Python普通字符串中

在Python中,我们用'\'来转义某些普通字符,使其成为特殊字符,比如

In [1]: print('abc\ndef') # '\n'具有换行的作用
abc
defg

In [2]: print('abc\tdef') # '\t'具有制位符的作用           
abc  defg

我们还可以用'\'来转义特殊字符,使其成为普通字符,比如

In [3]: print('abc\\tdef') # 使'\'成为一个普通的字符,没有转义作用
abc\tdef

In [4]: print('abc\'tdef') # 使'''成为一个普通的字符,不再需要和另一半单引号'''配对              
abc'tde

所以,在python普通字符串中,我们不能以奇数个'\'结尾,这样会导致结束的的引号转义成一个纯字符,从而使得这段字符串没有引号来结束。

在Python原生字符串中

我们在字符串前加一个'r'来表示原生字符串,比如r'abc'。原生字符串中的特殊字符的特殊含义将会被剥夺掉,如下

In [5]: print(r'abc\ndefg') # '\n'没有换行的作用,仅仅是一个普通的字符串             
abc\ndefg

In [6]: print(r'abc\tdefg') # '\t'没有制位符的作用,仅仅是一个普通的字符串          
abc\tdef

这里有一个奇怪的问题,在原生字符串中,虽然'\'成为了一个普通的字符串,但我们同样不能以奇数个'\'字符串结尾,这是因为Python正则表达式的原因,在正则表达式中我们将会解释这个问题。

在Python(regular express)正则表达式中

Python正则表达式中会有一些不同,正则表达式中指定了一些元字符(metacharacter),如下

. ^ $ * + ? { } [ ] \ | ( )

它们都具有特殊的含义,'\'也属于元字符。'\'既属于Python中的特殊字符,也属于正则中的元字符,所以使用时得非常小心。那么在正则中,'\'的作用是什么呢?我们看一个例子

In [7]: re.search('.', 'sd.f')               
Out[7]: <_sre.SRE_Match object; span=(0, 1), match='s'>

In [8]: re.search('\.', 'sd.f')              
Out[8]: <_sre.SRE_Match object; span=(2, 3), match='.'>In [9]: re.search('\n', 'sdfd\nfds')            Out[9]: <_sre.SRE_Match object; span=(4, 5), match='\n'>

"""
'.'作为一个元字符,它的特殊含义是匹配任意一个字符,而当我们在其前面加'\'后,它的特殊含义消失了,匹配到的是'.';而且'\'依然可以把Python中某些字符转义成特殊字符。
"""

所以,'\'的作用是剥夺元字符的特殊含义,使其成为一个Python字符,所以它还是会具有在Python普通字符串中的转义作用,比如'\n'依然表示换行。所以,'\'既是正则中的一个元字符,又是Python中的一个特殊字符。那么我们该如何匹配到纯字符'\'(无任何特殊意义)?

在正则中,'\'的作用是把元字符转义成Python字符串文字(a Python string literal),所以正则中的'\\'其实是其实是Python字符中的'\',它仍然还具有转义作用,所以在正则中我们还得对每个'\'再进行转义一次,即'\\\\',这样就可以匹配到纯字符'\'了。看下面例子

In [10]: re.search('\\\\', 'fsd\nfds') # 目标字符串中没有纯字符'\',所以匹配为空

In [11]: re.search('\\\\', 'fsd\\nfds')                     
Out[11]: <_sre.SRE_Match object; span=(3, 4), match='\\'> # Python字符串中,'\\'就是纯字符'\'

在re中反复的使用'\',这可能会生成大量的连续的反斜杠,从而导致某些字符串难以理解。解决的办法是用Python原生字符串来书写正则表达式,如下

In [12]: re.search(r'\\', 'fsd\\nfds') # 两个'\\'就可以匹配到纯字符'\'
Out[12]: <_sre.SRE_Match object; span=(3, 4), match='\\'>

另外,当我们用原生字符串来书写正则表达式时,Python字符中的特殊字符依然有效,比如

In [13]: re.search(r'\n', 'fsd\nfds')                      
Out[13]: <_sre.SRE_Match object; span=(3, 4), match='\n'>
"""
在Python字符中,r'\n'仅仅表示纯字符串'\n',没有换行的作用;在正则中,r'\n'依然还有换行的作用。所以此时我们不能用奇数个'\'来结尾某个正则表达式,这样导致结束的引号被转义成一个纯字符,无结束符号。所以,在Python原生字符串中,我们也同样规定不能用奇数个'\'来结尾。
"""

以上就是本次介绍的全部知识点内容,感谢大家对三水点靠木的支持。

Python 相关文章推荐
python实现自动登录人人网并访问最近来访者实例
Sep 26 Python
Python标准库内置函数complex介绍
Nov 25 Python
详解Python文本操作相关模块
Jun 22 Python
Python与R语言的简要对比
Nov 14 Python
Matplotlib 生成不同大小的subplots实例
May 25 Python
python绘制立方体的方法
Jul 02 Python
OpenCV 轮廓检测的实现方法
Jul 03 Python
Python autoescape标签用法解析
Jan 17 Python
详细分析Python可变对象和不可变对象
Jul 09 Python
PyCharm安装PyQt5及其工具(Qt Designer、PyUIC、PyRcc)的步骤详解
Nov 02 Python
python推导式的使用方法实例
Feb 28 Python
用python基于appium模块开发一个自动收取能量的小助手
Sep 25 Python
Django中间件拦截未登录url实例详解
Sep 03 #Python
如何为Python终端提供持久性历史记录
Sep 03 #Python
Python openpyxl读取单元格字体颜色过程解析
Sep 03 #Python
python xlwt如何设置单元格的自定义背景颜色
Sep 03 #Python
python实现静态web服务器
Sep 03 #Python
Python的Lambda函数用法详解
Sep 03 #Python
Python获取一个用户名的组ID过程解析
Sep 03 #Python
You might like
PHP调用三种数据库的方法(2)
2006/10/09 PHP
php自动加载机制的深入分析
2013/06/08 PHP
ecshop 2.72如何修改后台访问地址
2015/03/03 PHP
php获取POST数据的三种方法实例详解
2016/12/20 PHP
基于win2003虚拟机中apache服务器的访问
2017/08/01 PHP
PHP工厂模式、单例模式与注册树模式实例详解
2019/06/03 PHP
jquery实现的可隐藏重现的靠边悬浮层实例代码
2013/05/27 Javascript
js中的eventType事件及其浏览器支持性介绍
2013/11/29 Javascript
验证控件与Button的OnClientClick事件详细解析
2013/12/04 Javascript
jquery文档操作wrap()方法实例简述
2015/01/10 Javascript
js实现用户注册协议倒计时的方法
2015/01/21 Javascript
jquery实现相册一下滑动两次的方法
2015/02/09 Javascript
简介alert()与console.log()的不同
2015/08/26 Javascript
Vue.js每天必学之计算属性computed与$watch
2016/09/05 Javascript
AngulaJS路由 ui-router 传参实例
2017/04/28 Javascript
JS判断非空至少输入两个字符的简单实现方法
2017/06/23 Javascript
angular过滤器实现排序功能
2017/06/27 Javascript
Vue2.5 结合 Element UI 之 Table 和 Pagination 组件实现分页功能
2018/01/26 Javascript
解决vue打包之后静态资源图片失效的问题
2018/02/21 Javascript
解决element-ui中下拉菜单子选项click事件不触发的问题
2018/08/22 Javascript
微信小程序开发的基本流程步骤
2019/01/31 Javascript
layui树形菜单动态遍历的例子
2019/09/23 Javascript
python 装饰器功能以及函数参数使用介绍
2012/01/27 Python
Python中Class类用法实例分析
2015/11/12 Python
Python使用psutil获取进程信息的例子
2019/12/17 Python
简单了解django处理跨域请求最佳解决方案
2020/03/25 Python
matplotlib 使用 plt.savefig() 输出图片去除旁边的空白区域
2021/01/05 Python
CSS3 Backgrounds属性相关介绍
2011/05/11 HTML / CSS
详解CSS中iconfont的使用
2015/08/04 HTML / CSS
充分就业社区汇报材料
2014/05/07 职场文书
经典团队口号
2014/06/06 职场文书
先进教育工作者事迹材料
2014/12/23 职场文书
3.15消费者权益日活动总结
2015/02/09 职场文书
500字小学生检讨书
2015/02/19 职场文书
行政前台岗位职责
2015/04/16 职场文书
CSS3 制作的彩虹按钮样式
2021/04/11 HTML / CSS