编程 Python

详解Python正则表达式re模块

Posted in Python onMarch 19, 2019

正则是处理字符串最常用的方法，我们编码中到处可见正则的身影。

正则大同小异，python 中的正则跟其他语言相比略有差异：

1、替换字符串时，替换的字符串可以是一个函数
2、split 函数可以指定分割次数，这会导致有个坑
3、前项界定的表达式必须定长

下面详细描述下 re 模块的使用方法，其实，注意上面提到的三点差异就好

1、match

说明：
re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回 None。

语法：
re.match(pattern, string, flags=0)

flags为可选标识，多个标识可以通过按位或 (|) 来指定。如 re.I | re.M 被设置成 I 和 M 标识：

修饰符	描述
re.I	使匹配对大小写不敏感
re.L	做本地化识别（locale-aware）匹配
re.M	多行匹配，影响 ^ 和 $
re.S	使 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

匹配成功re.match方法返回一个匹配的对象，可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。group() 或 group(0)，返回整个正则表达式的匹配结果。

举例：

s= 'abc123abc'

print(re.match('[a-z]+', s))



　# <_sre.SRE_Match object; span=(0, 3), match='abc'>

print(re.match('[a-z]+', s).group(0))


# abc
print(re.match('[\d]+', s))





# None
print(re.match('[A-Z]+', s, re.I).group(0))
 # abc
print(re.match('[a-z]+', s).span())


　# (0, 3)

2、search

说明：
re.search 扫描整个字符串并返回第一个成功的匹配。

语法：
re.search(pattern, string, flags=0)

匹配成功re.search方法返回一个匹配的对象，否则返回None。可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

s = 'abc123abc'

print(re.search('[a-z]+', s).group())# abc
print(re.search('[a-z]+', s).span())
 # (0, 3)
print(re.search('[\d]+', s).group())
 # 123
print(re.search('[\d]+', s).span())
 # (3, 6)
print(re.search('xyz', s))



 # None

groupdict
groupdict 返回匹配到的所有命名子组的字典。

print(re.search('[a-z]+', s).groupdict())   # {}

print(re.search('(?P<letter>[a-z]+)(?P<num>\d+)', s).groupdict()) # {'num': '123', 'letter': 'abc'}

3、sub 和 subn

说明：
re.sub用于替换字符串中的匹配项。

re.subn返回一个元组，包含替换后的字符串及替换次数。

语法：
sub(pattern, repl, string, count=0, flags=0)

repl: 替换的字符串，也可为一个函数。

count: 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。

举例：

s = 'abc123abc'

print(re.sub('[\d]+', '数字', s))  # abc数字abc
print(re.sub('[a-z]+', '字母', s, 1)) # 字母123abc


# 将匹配的数字乘以 2
def double(matched):
 value = int(matched.group('value'))
 return str(value * 2)


# repl是一个函数
print(re.sub('(?P<value>\d+)', double, s))# abc246abc
print(re.subn('[\d]+', '数字', s))


 # ('abc数字abc', 1)
print(re.subn('[a-z]+', '字母', s,))


# ('字母123字母', 2)
print(re.subn('[a-z]+', '字母', s, 1))

 # ('字母123字母', 1)

4、compile

说明：
re.compile 用于编译正则表达式，生成一个正则表达式（Pattern）对象，供 match() 和 search() 这两个函数使用。

语法：
compile(pattern, flags=0)

举例：

s = 'abc123abc'

p = re.compile('[\d]+')

print(p.match(s, 4, 5).group(0)) # 2 从位置4开始匹配到位置5
print(p.search(s).group(0))   # 123

5、findall

说明：
re.findall 在字符串中查找正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表。

语法：
findall(pattern, string, flags=0)

举例：

s = 'abc123abc'

print(re.findall('[a-z]+', s)) # ['abc', 'abc']
print(re.findall('[h-n]+', s)) # []

6、finditer

说明：
finditer和 findall 类似，在字符串中查找正则表达式所匹配的所有子串，并把它们作为一个迭代器返回。

语法：
finditer(pattern, string, flags=0)

举例：

s = 'abc123def'

it = re.finditer('[a-z]+', s)

for match in it:
 print(match.group())

7、split

说明：
re.split 方法按照能够匹配的子串将字符串分割后返回列表。

语法：
split(pattern, string, maxsplit=0, flags=0)

maxsplit：分隔次数，maxsplit=1 分隔一次，默认为 0，不限制次数。

举例：

print(re.split('a', '1A1a2A3', re.I))   # ['1A1', '2A3']

# 输出结果并未能区分大小写，这是因为re.split(pattern，string，maxsplit, flags)默认是四个参数，当我们传入的三个参数的时候，系统会默认re.I是第三个参数，所以就没起作用。
# 如果想让这里的re.I起作用，写成flags=re.I即可。
print(re.split('a', '1A1a2A3', flags=re.I))  # ['1', '1', '2', '3']

8、escape

说明：
re.escape对字符串里面的特殊字符串进行转义。

语法：
escape(pattern)

举例：

print(re.escape('www.dxy.cn')) # www\.dxy\.cn

9、正则

“(?P<name>…)”：分组，并将其命名为<name>。

“(?P=name)”：引用别名为<name>的分组匹配到的串。

10、前项（否定）界定中的特殊

正则中常用的前项界定(?<=exp)和前项否定界定(?<!exp)在 python 中会报错：look-behind requires fixed-width pattern，原因是 python 中前项界定的表达式必须是定长的，例如

(?<=aaa) # 正确

(?<=aaa|bbb) # 正确

(?<=aaa|bb)　# 错误

(?<=\d+) 
# 错误

(?<=\d{3}) 　# 正确

以上所述是小编给大家介绍的Python正则表达式re模块详解整合，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持！

详解Python正则表达式re模块

- Author -

丹枫无迹

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

在Python3中使用asyncio库进行快速数据抓取的教程

Apr 02 Python

python中lambda与def用法对比实例分析

Apr 30 Python

python中os模块详解

Oct 14 Python

Python在不同目录下导入模块的实现方法

Oct 27 Python

python装饰器深入学习

Apr 06 Python

对python3标准库httpclient的使用详解

Dec 18 Python

Python实现的调用C语言函数功能简单实例

Mar 13 Python

使用python搭建服务器并实现Android端与之通信的方法

Jun 28 Python

python的pstuil模块使用方法总结

Jul 26 Python

numpy.linalg.eig() 计算矩阵特征向量方式

Nov 29 Python

PyTorch中反卷积的用法详解

Dec 30 Python

python属于软件吗

Jun 18 Python

python matplotlib画图库学习绘制常用的图

Mar 19 #Python

详解python的四种内置数据结构

Mar 19 #Python

python3使用matplotlib绘制条形图

Mar 25 #Python

python3使用matplotlib绘制散点图

Mar 19 #Python

浅谈PYTHON 关于文件的操作

Mar 19 #Python

python scatter散点图用循环分类法加图例

Mar 19 #Python

python使用matplotlib画柱状图、散点图

Mar 18 #Python

You might like

自动生成文章摘要的代码[PHP 版本]

2007/03/20 PHP

php学习笔记面向对象中[接口]与[多态性]的应用

2011/06/16 PHP

使用PHPCMS搭建wap手机网站

2015/09/20 PHP

ExtJS Store的数据访问与更新问题

2010/04/28 Javascript

Javascript 面向对象编程（一）封装

2011/08/28 Javascript

Jquery实现三层遍历删除功能代码

2013/04/23 Javascript

火狐下input焦点无法重复获取问题的解决方法

2014/06/16 Javascript

javascript获取元素偏移量的方法有哪些

2014/06/24 Javascript

angularjs基础教程

2014/12/25 Javascript

jQuery垂直多级导航菜单代码分享

2015/08/18 Javascript

javascript实现的登陆遮罩效果汇总

2015/11/09 Javascript

JavaScript必知必会(五) eval 的使用

2016/06/08 Javascript

Vue.js 2.0中select级联下拉框实例

2017/03/06 Javascript

解决JS外部文件中文注释出现乱码问题

2017/07/09 Javascript

layui框架中layer父子页面交互的方法分析

2017/11/15 Javascript

React 项目迁移 Webpack Babel7的实现

2018/09/12 Javascript

vue2.0移动端滑动事件vue-touch的实例代码

2018/11/27 Javascript

react-native滑动吸顶效果的实现过程

2019/06/03 Javascript

pm2启动ssr失败的解决方法

2019/06/29 Javascript

JQuery通过键盘控制键盘按下与松开触发事件

2020/08/07 jQuery

Vue管理系统前端之组件拆分封装详解

2020/08/23 Javascript

深入剖析Python的爬虫框架Scrapy的结构与运作流程

2016/01/20 Python

Python在图片中添加文字的两种方法

2017/04/29 Python

Python爬虫实现简单的爬取有道翻译功能示例

2018/07/13 Python

Python爬虫获取页面所有URL链接过程详解

2020/06/04 Python

html5 canvas 实现光线沿不规则路径运动

2020/04/20 HTML / CSS

美国眼镜在线零售商：Dualens

2019/12/07 全球购物

土木工程应届生求职信

2013/10/31 职场文书

学期自我评价

2014/01/27 职场文书

求职教师自荐书

2014/06/19 职场文书

建筑节能汇报材料

2014/08/22 职场文书

交通工程专业推荐信

2014/09/06 职场文书

乡镇机关党员民主评议表自我评价

2014/09/21 职场文书

旷工检讨书1000字

2015/01/01 职场文书

党支部创先争优公开承诺书

2015/04/30 职场文书

新学期开学标语2015

2015/07/16 职场文书