Python中正则表达式对单个字符,多个字符和匹配边界等使用


Posted in Python onJanuary 27, 2021

Regular Expression,正则表达式,又称正规表示式、正规表示法、正则表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。

Python 自1.5版本起增加了re 模块。re 模块使 Python 语言拥有全部的正则表达式功能。

1.re.match函数

   python用re.match函数从字符串的起始位置匹配一个模式,若字符串匹配正则表达式,则match方法返回匹配对象(Match Object),否则返回None(注意不是空字符串"")。匹配对象Macth Object具有group方法,用来返回字符串的匹配部分。

   函数语法:re.match(pattern, string, flags) ;pattern是正则表达式,string需要匹配的字符串,flags为可选参数修饰符。

# 导入re模块,注意match函数是从起始位置匹配的。如果起始位置匹配失败,则返回None
import re
#match()函数适合匹配是否以xxxx开始的字符串,因为其从头开始匹配的
ret = re.match("abc","aBCabc",re.I) #可选参数re.I表示忽略大小写,后续详细解释。
print(ret.group()) #aBC
ret1 = re.match("abc","aBCabc")
print(ret1.group()) # 'NoneType' object has no attribute 'group'

正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I | re.M 被设置成 I 和 M 标志:

修饰符 描述
re.I 使匹配对大小写不敏感
re.L 做本地化识别(locale-aware)匹配
re.M 多行匹配,影响 ^ 和 $
re.S 使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

2.正则表达式的语法

2.1正则表达式对字符(单个字符)的表示

字符 功能
. 匹配任意1个字符(除了\n),注意因为.表示任意一个字符,所以如果匹配‘.'则需要用转义字符\.来表示
[ ] 匹配[ ]中列举的字符,如果[a-zA-Z0-9],[a-zA-Z]表示所有字母和数字,后者表示所有字母,注意中间没有空格符号。
\d 匹配数字,即0-9
\D 匹配非数字,即不是数字
\s 匹配空白,即 空格,tab键
\S 匹配非空白
\w 匹配单词字符,即a-z、A-Z、0-9、_
\W 匹配非单词字符
# 导入re模块
import re
#1.测试.的使用,匹配任意字符开始的字符串
str='abc'
ret =re.match("..",str)
print(ret.group()) #ab.用两个..就表示只要str字符串开头是两个字符即可。
ret1 = re.match("....",str) #这种情况则会报错,因为str只有三个字符。
 
#2.匹配[]范围内的任意一个字符开头的字符串
str1 = "abcABC*?//"
str2 = "3afasdlfadsf"
ret2 = re.match("[a-z]",str1).group() #a
ret3 = re.match("[123456]",str2).group() #3,[1-6]等价[123456]
 
#3./d的使用,表示匹配任意一个数字
str3 = "第5名是我"
ret4 = re.match("第\d名",str3).group()
print(ret4) #第5名
 
ret4 = re.match("第[0-9]名",str3) #同样是表示0-9任意一个,[0-9]和\d效果一样
print(ret4.group()) #第5名

 总结:注意上面对字符的匹配都是表示一个任意字符,或者某个范围内的任意一个字符,属于单个字符匹配。而实际开发中肯定都是用一个子串(多个字符)去匹配整个字符串。那么如何表示呢,请继续下去。

2.2正则表达式匹配多个字符:数量的表示

匹配多个字符的相关格式,其实就是单个字符加上数量。注意下面数量的匹配都是针对前一个字符。

字符 功能
* 匹配前一个字符出现0次或者无限次,即可有可无
+ 匹配前一个字符出现1次或者无限次,即至少有1次
? 匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{m} 匹配前一个字符出现m次
{m,} 匹配前一个字符至少出现m次
{m,n} 匹配前一个字符出现从m到n次
# 导入re模块
import re
 
#1.匹配第一个是大写字母,第二个小写字母,后面只要是小写字母即可。
ret = re.match("[A-Z][a-z]*","Aafngsdfgnlsdf1224343")
print(ret.group()) #Aafngsdfgnlsdf
ret1 = re.match("[A-Z][a-z]*","AaAaaa34bbb")
print(ret1.group()) #Aa ,因为后面不是小写字母所以没匹配到。
 
#匹配下面字符串是否以字母或者下划线开头
ret = re.match("[a-zA-Z_]+[\w_]*","name1") #解释1:[a-zA-Z_]+字母下划线至少出现一次
print(ret.group()) #name1
 
ret = re.match("[a-zA-Z_]+[\w_]*","_name") #解释2:[\w_]*表示字母,数据下划线出现任意次
print(ret.group()) #_name
 
ret = re.match("[a-zA-Z_]+[\w_]*","2_name")
#print(ret.group()) #报错,因为匹配不上,返回None.
 
 
#3.匹配前面字符出现0次或者1次使用?
ret = re.match("[1-9]?[0-9]","7")
print(ret.group()) #7
 
ret = re.match("[1-9]?[0-9]","33")
print(ret.group()) #33
 
ret = re.match("[1-9]?[0-9]","09")
print(ret.group()) #0
 
#4.前面字符出现n此,或者m-n范围内的任意次
ret = re.match("[a-zA-Z0-9_]{6}","dsa2A9nfdsf")
print(ret.group()) #dsa2A9,匹配前6位是数字字符下划线即可
 
ret = re.match("[a-zA-Z0-9_]{3,8}","aSjsd239344")
ret1 = re.match("[a-zA-Z0-9_]{3,8}","aSjs")
print(ret1.group()) #aSjs,注意匹配前一个字符出现3-8次,只要这个范围内都算匹配成功,按实际匹配
print(ret.group()) #aSjsd239 匹配前一个字符出现3到8次
 
ret = re.match("[a-z0-9A-Z_]{3,}","a2")
print(ret.group()) #至少出现3次,所以如果只有两个的话,返回None,调用报错。

总结:单个字符匹配,多个字符匹配上面都已经演示过了,基本可以完成大多数字符串的匹配了。但是上面过于字符串的匹配都是从头开始匹配的,而实际开发中可能是从字符串中间,后者结尾开始匹配的。keep reading....

2.3.正则表达式:匹配边界的问题

字符 功能
^ 匹配字符串开头
$ 匹配字符串结尾
\b 匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B 匹配非单词边界,'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
# 导入re模块
import re
 
# 匹配以@qq.com邮箱结尾的邮箱地址
#1.不适用匹配字符串结尾的$来实现,注意.要用转义字符,一般邮箱的长度都是4-30位
ret = re.match("[\w]{4,30}@qq\.com", "xiaoWang@qq.com")
print(ret.group()) #xiaoWang@qq.com
 
 
# 通过$来确定末尾,效率更高
ret = re.match("[\w]{4,30}@qq\.com$", "xiaoWang@qq.com")
print(ret.group()) #xiaoWang@qq.com
 
ret = re.match("[\w]{4,30}@qq\.com$", "xiaoWang@qq.com.cn")
#print(ret.group()) #报错

到此这篇关于Python中正则表达式对单个字符,多个字符和匹配边界等使用的文章就介绍到这了,更多相关Python 单字符,多字符匹配内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用urlparse分析网址中域名的方法
Apr 15 Python
python中import学习备忘笔记
Jan 24 Python
在Python中执行系统命令的方法示例详解
Sep 14 Python
python使用fork实现守护进程的方法
Nov 16 Python
python实现生命游戏的示例代码(Game of Life)
Jan 24 Python
人脸识别经典算法一 特征脸方法(Eigenface)
Mar 13 Python
Pandas 数据框增、删、改、查、去重、抽样基本操作方法
Apr 12 Python
解决Python2.7中IDLE启动没有反应的问题
Nov 30 Python
Python基于DB-API操作MySQL数据库过程解析
Apr 23 Python
解决导入django_filters不成功问题No module named 'django_filter'
Jul 15 Python
python遍历路径破解表单的示例
Nov 21 Python
python元组打包和解包过程详解
Aug 02 Python
python正则表达式re.match()匹配多个字符方法的实现
Jan 27 #Python
python工具快速为音视频自动生成字幕(使用说明)
Jan 27 #Python
详解appium自动化测试工具(monitor、uiautomatorviewer)
Jan 27 #Python
Python利用socket模块开发简单的端口扫描工具的实现
Jan 27 #Python
Python爬虫实现selenium处理iframe作用域问题
Jan 27 #Python
python利用appium实现手机APP自动化的示例
Jan 26 #Python
python 基于opencv去除图片阴影
Jan 26 #Python
You might like
PHP stream_context_create()作用和用法分析
2011/03/29 PHP
CI框架中zip类应用示例
2014/06/17 PHP
详解PHP中websocket的使用方法
2016/09/15 PHP
laravel-admin的图片删除实例
2019/09/30 PHP
PHP设计模式之适配器模式(Adapter)原理与用法详解
2019/12/12 PHP
JavaScript toFixed() 方法
2010/04/15 Javascript
php对mongodb的扩展(初识如故)
2012/11/11 Javascript
图片上传判断及预览脚本的效果实例
2013/08/07 Javascript
jquery 3D 标签云示例代码
2014/06/12 Javascript
JS禁用页面上所有控件的实现方法(附demo源码下载)
2015/12/17 Javascript
AngularJS进行性能调优的7个建议
2015/12/28 Javascript
jQuery日历插件datepicker用法详解
2016/03/03 Javascript
Angular.js中定时器循环的3种方法总结
2017/04/27 Javascript
vue iview实现动态路由和权限验证功能
2018/04/17 Javascript
简单说说如何使用vue-router插件的方法
2019/04/08 Javascript
vue实现跳转接口push 转场动画示例
2019/11/01 Javascript
js的Object.assign用法示例分析
2020/03/05 Javascript
vue中defineProperty和Proxy的区别详解
2020/11/30 Vue.js
[59:07]海涛为你详解DOTA2新版本“贤哲秘契”
2014/11/22 DOTA
Python文件夹与文件的相关操作(推荐)
2016/07/25 Python
Python实现的矩阵类实例
2017/08/22 Python
pandas进行时间数据的转换和计算时间差并提取年月日
2019/07/06 Python
python自定义时钟类、定时任务类
2021/02/22 Python
python实现批量修改服务器密码的方法
2019/08/13 Python
python pandas.DataFrame.loc函数使用详解
2020/03/26 Python
python基于socket函数实现端口扫描
2020/05/28 Python
浅谈python出错时traceback的解读
2020/07/15 Python
python如何快速生成时间戳
2020/07/21 Python
Expected conditions模块使用方法汇总代码解析
2020/08/13 Python
Finishline官网:美国一家领先的运动品牌鞋类、服装零售商
2016/07/20 全球购物
夏威夷航空官网:Hawaiian Airlines
2016/09/11 全球购物
Bench加拿大官方网站:英国城市服装品牌
2017/11/03 全球购物
进程的查看和调度分别使用什么命令
2013/12/14 面试题
森林病虫害防治方案
2014/06/02 职场文书
商场客服专员岗位职责
2014/06/13 职场文书
财务会计个人原因辞职信
2019/06/21 职场文书