详解Python正则表达式re模块


Posted in Python onMarch 19, 2019

正则是处理字符串最常用的方法,我们编码中到处可见正则的身影。

正则大同小异,python 中的正则跟其他语言相比略有差异:

1、替换字符串时,替换的字符串可以是一个函数
2、split 函数可以指定分割次数,这会导致有个坑
3、前项界定的表达式必须定长

下面详细描述下 re 模块的使用方法,其实,注意上面提到的三点差异就好

1、match

说明:
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回 None。

语法:
re.match(pattern, string, flags=0)

flags为可选标识,多个标识可以通过按位或 (|) 来指定。如 re.I | re.M 被设置成 I 和 M 标识:

修饰符 描述
re.I 使匹配对大小写不敏感
re.L 做本地化识别(locale-aware)匹配
re.M 多行匹配,影响 ^ 和 $
re.S 使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

匹配成功re.match方法返回一个匹配的对象,可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。group() 或 group(0),返回整个正则表达式的匹配结果。

举例:

s= 'abc123abc'

print(re.match('[a-z]+', s))



 # <_sre.SRE_Match object; span=(0, 3), match='abc'>

print(re.match('[a-z]+', s).group(0))


# abc
print(re.match('[\d]+', s))





# None
print(re.match('[A-Z]+', s, re.I).group(0))
 # abc
print(re.match('[a-z]+', s).span())


 # (0, 3)

2、search

说明:
re.search 扫描整个字符串并返回第一个成功的匹配。

语法:
re.search(pattern, string, flags=0)

匹配成功re.search方法返回一个匹配的对象,否则返回None。可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

s = 'abc123abc'

print(re.search('[a-z]+', s).group())# abc
print(re.search('[a-z]+', s).span())
 # (0, 3)
print(re.search('[\d]+', s).group())
 # 123
print(re.search('[\d]+', s).span())
 # (3, 6)
print(re.search('xyz', s))



 # None

groupdict
groupdict 返回匹配到的所有命名子组的字典。

print(re.search('[a-z]+', s).groupdict())   # {}

print(re.search('(?P<letter>[a-z]+)(?P<num>\d+)', s).groupdict()) # {'num': '123', 'letter': 'abc'}

3、sub 和 subn

说明:
re.sub用于替换字符串中的匹配项。

re.subn返回一个元组,包含替换后的字符串及替换次数。

语法:
sub(pattern, repl, string, count=0, flags=0)

repl: 替换的字符串,也可为一个函数。

count: 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。

举例:

s = 'abc123abc'

print(re.sub('[\d]+', '数字', s))  # abc数字abc
print(re.sub('[a-z]+', '字母', s, 1)) # 字母123abc


# 将匹配的数字乘以 2
def double(matched):
 value = int(matched.group('value'))
 return str(value * 2)


# repl是一个函数
print(re.sub('(?P<value>\d+)', double, s))# abc246abc
print(re.subn('[\d]+', '数字', s))


 # ('abc数字abc', 1)
print(re.subn('[a-z]+', '字母', s,))


# ('字母123字母', 2)
print(re.subn('[a-z]+', '字母', s, 1))

 # ('字母123字母', 1)

4、compile

说明:
re.compile 用于编译正则表达式,生成一个正则表达式(Pattern)对象,供 match() 和 search() 这两个函数使用。

语法:
compile(pattern, flags=0)

举例:

s = 'abc123abc'

p = re.compile('[\d]+')

print(p.match(s, 4, 5).group(0)) # 2 从位置4开始匹配到位置5
print(p.search(s).group(0))   # 123

5、findall

说明:
re.findall 在字符串中查找正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

语法:
findall(pattern, string, flags=0)

举例:

s = 'abc123abc'

print(re.findall('[a-z]+', s)) # ['abc', 'abc']
print(re.findall('[h-n]+', s)) # []

6、finditer

说明:
finditer和 findall 类似,在字符串中查找正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。

语法:
finditer(pattern, string, flags=0)

举例:

s = 'abc123def'

it = re.finditer('[a-z]+', s)

for match in it:
 print(match.group())

7、split

说明:
re.split 方法按照能够匹配的子串将字符串分割后返回列表。

语法:
split(pattern, string, maxsplit=0, flags=0)

maxsplit:分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。

举例:

print(re.split('a', '1A1a2A3', re.I))   # ['1A1', '2A3']

# 输出结果并未能区分大小写,这是因为re.split(pattern,string,maxsplit, flags)默认是四个参数,当我们传入的三个参数的时候,系统会默认re.I是第三个参数,所以就没起作用。
# 如果想让这里的re.I起作用,写成flags=re.I即可。
print(re.split('a', '1A1a2A3', flags=re.I))  # ['1', '1', '2', '3']

8、escape

说明:
re.escape对字符串里面的特殊字符串进行转义。

语法:
escape(pattern)

举例:

print(re.escape('www.dxy.cn')) # www\.dxy\.cn

9、正则

“(?P<name>…)”:分组,并将其命名为<name>。

“(?P=name)”:引用别名为<name>的分组匹配到的串。

10、前项(否定)界定中的特殊

正则中常用的前项界定(?<=exp)和前项否定界定(?<!exp)在 python 中会报错:look-behind requires fixed-width pattern,原因是 python 中前项界定的表达式必须是定长的,例如

(?<=aaa) # 正确

(?<=aaa|bbb) # 正确

(?<=aaa|bb) # 错误

(?<=\d+) 
# 错误

(?<=\d{3})  # 正确

以上所述是小编给大家介绍的Python正则表达式re模块详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python list使用示例 list中找连续的数字
Jan 27 Python
python实现封装得到virustotal扫描结果
Oct 05 Python
使用Python编写一个简单的tic-tac-toe游戏的教程
Apr 16 Python
Python实现读取txt文件并画三维图简单代码示例
Dec 09 Python
python+VTK环境搭建及第一个简单程序代码
Dec 13 Python
Python numpy 提取矩阵的某一行或某一列的实例
Apr 03 Python
利用Python对文件夹下图片数据进行批量改名的代码实例
Feb 21 Python
python lambda函数及三个常用的高阶函数
Feb 05 Python
Python如何转换字符串大小写
Jun 04 Python
推荐值得学习的12款python-web开发框架
Aug 10 Python
python将字典内容写入json文件的实例代码
Aug 12 Python
详解python日志输出使用配置文件格式
Feb 10 Python
python matplotlib画图库学习绘制常用的图
Mar 19 #Python
详解python的四种内置数据结构
Mar 19 #Python
python3使用matplotlib绘制条形图
Mar 25 #Python
python3使用matplotlib绘制散点图
Mar 19 #Python
浅谈PYTHON 关于文件的操作
Mar 19 #Python
python scatter散点图用循环分类法加图例
Mar 19 #Python
python使用matplotlib画柱状图、散点图
Mar 18 #Python
You might like
PHP连接access数据库
2008/03/27 PHP
PHP安全配置详细说明
2011/09/26 PHP
php实现网站留言板功能
2015/11/04 PHP
php正则表达式学习笔记
2015/11/13 PHP
jQuery 位置插件
2008/12/25 Javascript
JavaScript isArray()函数判断对象类型的种种方法
2010/10/11 Javascript
jQuery的初始化与对象构建之浅析
2011/04/12 Javascript
JavaScript下通过的XMLHttpRequest发送请求的代码
2011/06/28 Javascript
实例代码详解javascript实现窗口抖动及qq窗口抖动
2016/01/04 Javascript
AngularJS 2.0新特性有哪些
2016/02/18 Javascript
Vue单文件组件基础模板小结
2017/08/10 Javascript
JS中的Replace()传入函数时的用法详解
2017/09/11 Javascript
JS小球抛物线轨迹运动的两种实现方法详解
2017/12/20 Javascript
Vue2实时监听表单变化的示例讲解
2018/08/30 Javascript
JS复杂判断的更优雅写法代码详解
2018/11/07 Javascript
js比较两个单独的数组或对象是否相等的实例代码
2019/04/28 Javascript
Vue+Element实现动态生成新表单并添加验证功能
2019/05/23 Javascript
vue中 数字相加为字串转化为数值的例子
2019/11/07 Javascript
Echarts实现单条折线可拖拽效果
2019/12/19 Javascript
微信小程序实现页面浮动导航
2020/01/08 Javascript
JavaScript 禁止用户保存图片的实现代码
2020/04/28 Javascript
如何准确判断请求是搜索引擎爬虫(蜘蛛)发出的请求
2015/10/13 Python
13个最常用的Python深度学习库介绍
2017/10/28 Python
PyQt4编程之让状态栏显示信息的方法
2019/06/18 Python
浅析python实现动态规划背包问题
2020/12/31 Python
浅谈Selenium+Webdriver 常用的元素定位方式
2021/01/13 Python
美国第二大团购网站:LivingSocial
2016/07/24 全球购物
GOLFINO英国官网:高尔夫服装
2020/04/11 全球购物
J2EE中的容器都包括哪些
2013/08/21 面试题
如何写一份好的自荐信
2014/01/02 职场文书
对标管理实施方案
2014/03/12 职场文书
法院干警四风问题个人对照检查材料思想汇报
2014/10/07 职场文书
单位租车协议书
2015/01/29 职场文书
2015年推普周活动方案
2015/05/06 职场文书
2015年秋季小班开学寄语
2015/05/27 职场文书
进阶篇之linux环境下安装MySQL数据库
2022/04/09 MySQL