编程 Python

Java及python正则表达式详解

Posted in Python onDecember 27, 2017

正则表达式语法及常用元字符：

正则表达式有元字符及不同组合来构成，通过巧妙的构造正则表达式可以匹配任意字符串，并完成复杂的字符串处理任务。

常用的元字符有：

其中在使用反斜线时要注意：如果以‘\'开头的元字符与转义字符相同，则需要使用‘\\'或者原始字符串，在字符串前面加上字符‘r'或‘R'。原始字符串可以减少用户的输入，主要用于‘\\'，主要用于正则表达式和文件路径字符串，如果字符串以一个‘\'结束，则需要多加一个斜线，以‘\\'结束。

Java及python正则表达式详解

\ :将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如，'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。

常用正则表达式的写法：

‘[a-zA-Z0-9]'：匹配字母或数字
‘[^abc]'：匹配除abc之外的字母
‘p(ython|erl)'匹配Python和perl
‘(pattern)*'匹配0次或多次
‘(pattern)+'匹配1次或多次
‘(pattern){m,n}'匹配m_n次
‘(a|b)*c'匹配0-n次a或b后面紧跟c
‘^[a-zA-Z]{1}([a-zA-Z0-9\._]){4,19}$'匹配20个字符以字母开始
‘^(\w){6,20}$'匹配6-20个单词字符
‘^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$'匹配IP
‘^[a-zA-Z]+$'检查字符中只包含英文字母
‘\w+@(\w+\.)\w+$'匹配邮箱
‘[\u4e00-\u9fa5]'匹配汉字
‘^\d{18|\d{15}$'匹配身份证
‘\d{4}-\d{1,2}-\d{1,2}'匹配时间
‘^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)(?=.*[,._]).{8,}$)'判断是否为强密码
‘(.)\\1+'匹配任意字符的一次或多次出现

re模块常用方法介绍：

compile(pattern[,flags])创建模式对象
search(pattern,string[,flags])在整个字符中寻找模式，返回match对象或者None
match(pattern,string[,flags])从字符串的开始处于匹配模式，返回匹配对象
findall(pattern,string[,flags])：列出匹配模式中的所有匹配项
split(pattern,string[,maxsplit=0])根据匹配模式分割字符串
sub(pat,repl,string[,count=0])将字符串中所有pat匹配项用repl替换
escape(string)将字符中的所有特殊正则表达式字符转义

match，search，findall区别

match在字符串开头或指定位置进行搜索，模式必须出现在开头或指定位置；
search方法在整个字符串或指定位置进行搜索；
findall在字符串中查找所有符合正则表达式的字符串并以列表返回。

子模式与match对象

正则表达式中match和search方法匹配成功后都会返回match对象，其中match对象的主要方法有group()（返回匹配的一个或多个子模式内容），groups()（方法返回一个包含匹配所有子模式内容的元组），groupdict()（方法返回一个包含匹配所有子模式内容的字典），start()（返回子模式内容的起始位置），end()（返回子模式内容的结束位置）span()（返回包含指定子模式内容起始位置和结束位置前一个位置的元组）

代码演示

>>> import re
>>> m = re.match(r'(\w+) (\w+)','Isaac Newton,physicist')
>>> m.group(0)
'Isaac Newton'
>>> m.group(1)
'Isaac'
>>> m.group(2)
'Newton'
>>> m.group(1,2)
('Isaac', 'Newton')
>>>m=re.match(r'(?P<first_name>\w+)(?P<last_name>\w+)','Malcolm Reynolds')
>>> m.group('first_name')
'Malcolm'
>>> m.group('last_name')
'Reynolds'
>>> m.groups()
('Malcolm', 'Reynolds')
>>> m.groupdict()
{'first_name': 'Malcolm', 'last_name': 'Reynolds'}

验证并理解子模式扩展语法的功能

>>> import re
>>> exampleString = '''There should be one--and preferably only one--obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never. 
Although never never is often better than right now.'''
>>> pattern = re.compile(r'(?<=\w\s)never(?=\s\w)')
>>> matchResult = pattern.search(exampleString)
>>> matchResult.span()
(171, 176)
>>> pattern = re.compile(r'(?<=\w\s)never')
>>> matchResult = pattern.search(exampleString)
>>> matchResult.span()
(154, 159)
>>> pattern = re.compile(r'(?:is\s)better(\sthan)')
>>> matchResult = pattern.search(exampleString)
>>> matchResult.span()
(139, 153)
>>> matchResult.group(0)
'is better than'
>>> matchResult.group(1)
' than'
>>> pattern = re.compile(r'\b(?i)n\w+\b')
>>> index = 0
>>> while True:
 matchResult = pattern.search(exampleString,index)
 if not matchResult:
 break
 print(matchResult.group(0),':',matchResult.span(0))
 index = matchResult.end(0)

not : (90, 93)
Now : (135, 138)
never : (154, 159)
never : (171, 176)
never : (177, 182)
now : (210, 213)
>>> pattern = re.compile(r'(?<!not\s)be\b')
>>> index = 0
>>> while True:
 matchResult = pattern.search(exampleString,index)
 if not matchResult:
 break
 print(matchResult.group(0),':',matchResult.span(0))
 index = matchResult.end(0)

be : (13, 15)
>>> exampleString[13:20]
'be one-'
>>> pattern = re.compile(r'(\b\w*(?P<f>\w+)(?P=f)\w*\b)')
>>> index = 0
>>> while True:
 matchResult = pattern.search(exampleString,index)
 if not matchResult:
 break
 print(matchResult.group(0),':',matchResult.group(2))
 index = matchResult.end(0)+1

unless : s
better : t
better : t
>>> s = 'aabc abbcd abccd abbcd abcdd'
>>> p = re.compile(r'(\b\w*(?P<f>\w+)(?P=f)\w*\b)')
>>> p.findall(s)
[('aabc', 'a'), ('abbcd', 'b'), ('abccd', 'c'), ('abbcd', 'b'), ('abcdd', 'd')]

以上就是关于python正则表达式的相关内容，更多资料请查看三水点靠木以前的文章。

Java及python正则表达式详解

- Author -

mdxy-dxy

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Pyhton中防止SQL注入的方法

Feb 05 Python

python用装饰器自动注册Tornado路由详解

Feb 14 Python

linecache模块加载和缓存文件内容详解

Jan 11 Python

windows10下python3.5 pip3安装图文教程

Apr 02 Python

Python3爬楼梯算法示例

Mar 04 Python

pyqt5 实现在别的窗口弹出进度条

Jun 18 Python

ERLANG和PYTHON互通实现过程详解

Jul 05 Python

使用Python制作表情包实现换脸功能

Jul 19 Python

VSCode中自动为Python文件添加头部注释

Nov 14 Python

使用python采集Excel表中某一格数据

May 14 Python

Python爬虫之Selenium下拉框处理的实现

Dec 04 Python

使用python绘制横竖条形图

Apr 21 Python

python matplotlib画图实例代码分享

Dec 27 #Python

python爬虫使用cookie登录详解

Dec 27 #Python

Python爬虫番外篇之Cookie和Session详解

Dec 27 #Python

Python并发编程协程(Coroutine)之Gevent详解

Dec 27 #Python

利用 python 对目录下的文件进行过滤删除

Dec 27 #Python

python中使用%与.format格式化文本方法解析

Dec 27 #Python

python类的方法属性与方法属性的动态绑定代码详解

Dec 27 #Python

You might like

成本8450万，票房仅2亿，口碑两极分化，又一部DC电影扑街了

2020/04/09 欧美动漫

PHP 数组教程定义数组

2009/10/23 PHP

在IIS7.0下面配置PHP 5.3.2运行环境的方法

2010/04/13 PHP

discuz的php防止sql注入函数

2011/01/17 PHP

php数组函数序列之each() - 获取数组当前内部指针所指向元素的键名和键值，并将指针移到下一位

2011/10/31 PHP

php中的静态变量的基本用法

2014/03/20 PHP

WordPress中编写自定义存储字段的相关PHP函数解析

2015/12/25 PHP

PHP 网站修改默认访问文件的nginx配置

2017/05/27 PHP

php弹出提示框的是实例写法

2019/09/26 PHP

javascript中运用闭包和自执行函数解决大量的全局变量问题

2010/12/30 Javascript

js数组中如何随机取出一个值

2014/06/13 Javascript

js实现右下角提示框的方法

2015/02/03 Javascript

jquery ajax 如何向jsp提交表单数据

2015/08/23 Javascript

Jquery 效果使用详解

2015/11/23 Javascript

javascript基础知识

2016/06/07 Javascript

javascript运算符语法全面概述

2016/07/14 Javascript

JavaScript中windows.open()、windows.close()方法详解

2016/07/28 Javascript

js发送短信倒计时的简单实现方法

2016/09/08 Javascript

Vue.js基础学习之class与样式绑定

2017/03/20 Javascript

vue-cli实现多页面多路由的示例代码

2018/01/30 Javascript

vue项目开发中setTimeout等定时器的管理问题

2018/09/13 Javascript

vue-cli3全面配置详解

2018/11/14 Javascript

create-react-app使用antd按需加载的样式无效问题的解决

2019/02/26 Javascript

详解Python中__str__和__repr__方法的区别

2015/04/17 Python

Python的字典和列表的使用中一些需要注意的地方

2015/04/24 Python

Python输出由1,2,3,4组成的互不相同且无重复的三位数

2018/02/01 Python

Python利用正则表达式实现计算器算法思路解析

2018/04/25 Python

Python Pandas中根据列的值选取多行数据

2019/07/08 Python

Python中的With语句的使用及原理

2020/07/29 Python

python设置中文界面实例方法

2020/10/27 Python

亚历山大·王官网：Alexander Wang

2017/06/23 全球购物

80后职场人的职业生涯规划

2014/03/08 职场文书

派出所副所长四风问题个人整改措施思想汇报

2014/10/13 职场文书

省级三好学生主要事迹材料

2015/11/03 职场文书

小学教代会开幕词

2016/03/04 职场文书

Python TypeError: ‘float‘ object is not subscriptable错误解决

2022/12/24 Python