Python中正则表达式对单个字符,多个字符和匹配边界等使用


Posted in Python onJanuary 27, 2021

Regular Expression,正则表达式,又称正规表示式、正规表示法、正则表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。

Python 自1.5版本起增加了re 模块。re 模块使 Python 语言拥有全部的正则表达式功能。

1.re.match函数

   python用re.match函数从字符串的起始位置匹配一个模式,若字符串匹配正则表达式,则match方法返回匹配对象(Match Object),否则返回None(注意不是空字符串"")。匹配对象Macth Object具有group方法,用来返回字符串的匹配部分。

   函数语法:re.match(pattern, string, flags) ;pattern是正则表达式,string需要匹配的字符串,flags为可选参数修饰符。

# 导入re模块,注意match函数是从起始位置匹配的。如果起始位置匹配失败,则返回None
import re
#match()函数适合匹配是否以xxxx开始的字符串,因为其从头开始匹配的
ret = re.match("abc","aBCabc",re.I) #可选参数re.I表示忽略大小写,后续详细解释。
print(ret.group()) #aBC
ret1 = re.match("abc","aBCabc")
print(ret1.group()) # 'NoneType' object has no attribute 'group'

正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I | re.M 被设置成 I 和 M 标志:

修饰符 描述
re.I 使匹配对大小写不敏感
re.L 做本地化识别(locale-aware)匹配
re.M 多行匹配,影响 ^ 和 $
re.S 使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

2.正则表达式的语法

2.1正则表达式对字符(单个字符)的表示

字符 功能
. 匹配任意1个字符(除了\n),注意因为.表示任意一个字符,所以如果匹配‘.'则需要用转义字符\.来表示
[ ] 匹配[ ]中列举的字符,如果[a-zA-Z0-9],[a-zA-Z]表示所有字母和数字,后者表示所有字母,注意中间没有空格符号。
\d 匹配数字,即0-9
\D 匹配非数字,即不是数字
\s 匹配空白,即 空格,tab键
\S 匹配非空白
\w 匹配单词字符,即a-z、A-Z、0-9、_
\W 匹配非单词字符
# 导入re模块
import re
#1.测试.的使用,匹配任意字符开始的字符串
str='abc'
ret =re.match("..",str)
print(ret.group()) #ab.用两个..就表示只要str字符串开头是两个字符即可。
ret1 = re.match("....",str) #这种情况则会报错,因为str只有三个字符。
 
#2.匹配[]范围内的任意一个字符开头的字符串
str1 = "abcABC*?//"
str2 = "3afasdlfadsf"
ret2 = re.match("[a-z]",str1).group() #a
ret3 = re.match("[123456]",str2).group() #3,[1-6]等价[123456]
 
#3./d的使用,表示匹配任意一个数字
str3 = "第5名是我"
ret4 = re.match("第\d名",str3).group()
print(ret4) #第5名
 
ret4 = re.match("第[0-9]名",str3) #同样是表示0-9任意一个,[0-9]和\d效果一样
print(ret4.group()) #第5名

 总结:注意上面对字符的匹配都是表示一个任意字符,或者某个范围内的任意一个字符,属于单个字符匹配。而实际开发中肯定都是用一个子串(多个字符)去匹配整个字符串。那么如何表示呢,请继续下去。

2.2正则表达式匹配多个字符:数量的表示

匹配多个字符的相关格式,其实就是单个字符加上数量。注意下面数量的匹配都是针对前一个字符。

字符 功能
* 匹配前一个字符出现0次或者无限次,即可有可无
+ 匹配前一个字符出现1次或者无限次,即至少有1次
? 匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{m} 匹配前一个字符出现m次
{m,} 匹配前一个字符至少出现m次
{m,n} 匹配前一个字符出现从m到n次
# 导入re模块
import re
 
#1.匹配第一个是大写字母,第二个小写字母,后面只要是小写字母即可。
ret = re.match("[A-Z][a-z]*","Aafngsdfgnlsdf1224343")
print(ret.group()) #Aafngsdfgnlsdf
ret1 = re.match("[A-Z][a-z]*","AaAaaa34bbb")
print(ret1.group()) #Aa ,因为后面不是小写字母所以没匹配到。
 
#匹配下面字符串是否以字母或者下划线开头
ret = re.match("[a-zA-Z_]+[\w_]*","name1") #解释1:[a-zA-Z_]+字母下划线至少出现一次
print(ret.group()) #name1
 
ret = re.match("[a-zA-Z_]+[\w_]*","_name") #解释2:[\w_]*表示字母,数据下划线出现任意次
print(ret.group()) #_name
 
ret = re.match("[a-zA-Z_]+[\w_]*","2_name")
#print(ret.group()) #报错,因为匹配不上,返回None.
 
 
#3.匹配前面字符出现0次或者1次使用?
ret = re.match("[1-9]?[0-9]","7")
print(ret.group()) #7
 
ret = re.match("[1-9]?[0-9]","33")
print(ret.group()) #33
 
ret = re.match("[1-9]?[0-9]","09")
print(ret.group()) #0
 
#4.前面字符出现n此,或者m-n范围内的任意次
ret = re.match("[a-zA-Z0-9_]{6}","dsa2A9nfdsf")
print(ret.group()) #dsa2A9,匹配前6位是数字字符下划线即可
 
ret = re.match("[a-zA-Z0-9_]{3,8}","aSjsd239344")
ret1 = re.match("[a-zA-Z0-9_]{3,8}","aSjs")
print(ret1.group()) #aSjs,注意匹配前一个字符出现3-8次,只要这个范围内都算匹配成功,按实际匹配
print(ret.group()) #aSjsd239 匹配前一个字符出现3到8次
 
ret = re.match("[a-z0-9A-Z_]{3,}","a2")
print(ret.group()) #至少出现3次,所以如果只有两个的话,返回None,调用报错。

总结:单个字符匹配,多个字符匹配上面都已经演示过了,基本可以完成大多数字符串的匹配了。但是上面过于字符串的匹配都是从头开始匹配的,而实际开发中可能是从字符串中间,后者结尾开始匹配的。keep reading....

2.3.正则表达式:匹配边界的问题

字符 功能
^ 匹配字符串开头
$ 匹配字符串结尾
\b 匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B 匹配非单词边界,'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
# 导入re模块
import re
 
# 匹配以@qq.com邮箱结尾的邮箱地址
#1.不适用匹配字符串结尾的$来实现,注意.要用转义字符,一般邮箱的长度都是4-30位
ret = re.match("[\w]{4,30}@qq\.com", "xiaoWang@qq.com")
print(ret.group()) #xiaoWang@qq.com
 
 
# 通过$来确定末尾,效率更高
ret = re.match("[\w]{4,30}@qq\.com$", "xiaoWang@qq.com")
print(ret.group()) #xiaoWang@qq.com
 
ret = re.match("[\w]{4,30}@qq\.com$", "xiaoWang@qq.com.cn")
#print(ret.group()) #报错

到此这篇关于Python中正则表达式对单个字符,多个字符和匹配边界等使用的文章就介绍到这了,更多相关Python 单字符,多字符匹配内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
优化Python代码使其加快作用域内的查找
Mar 30 Python
用实例解释Python中的继承和多态的概念
Apr 27 Python
Python的dict字典结构操作方法学习笔记
May 07 Python
用Python编写一个高效的端口扫描器的方法
Dec 20 Python
python实现批量nii文件转换为png图像
Jul 18 Python
python实现倒计时小工具
Jul 29 Python
Python实现滑动平均(Moving Average)的例子
Aug 24 Python
python用pip install时安装失败的一系列问题及解决方法
Feb 24 Python
Keras:Unet网络实现多类语义分割方式
Jun 11 Python
opencv 图像滤波(均值,方框,高斯,中值)
Jul 08 Python
python爬虫线程池案例详解(梨视频短视频爬取)
Feb 20 Python
Python 一键获取电脑浏览器的账号密码
May 11 Python
python正则表达式re.match()匹配多个字符方法的实现
Jan 27 #Python
python工具快速为音视频自动生成字幕(使用说明)
Jan 27 #Python
详解appium自动化测试工具(monitor、uiautomatorviewer)
Jan 27 #Python
Python利用socket模块开发简单的端口扫描工具的实现
Jan 27 #Python
Python爬虫实现selenium处理iframe作用域问题
Jan 27 #Python
python利用appium实现手机APP自动化的示例
Jan 26 #Python
python 基于opencv去除图片阴影
Jan 26 #Python
You might like
PHP 变量定义和变量替换的方法
2009/07/30 PHP
基于Snoopy的PHP近似完美获取网站编码的代码
2011/10/23 PHP
php生成局部唯一识别码LUID的代码
2012/10/06 PHP
php模拟post上传图片实现代码
2016/06/24 PHP
PHP PDOStatement::setAttribute讲解
2019/02/01 PHP
可自己添加html的伪弹出框实现代码
2013/09/08 Javascript
jQuery中prev()方法用法实例
2015/01/08 Javascript
基于jquery实现select选择框内容左右移动添加删除代码分享
2015/08/25 Javascript
谈谈我对JavaScript原型和闭包系列理解(随手笔记6)
2015/12/20 Javascript
jQuery获取cookie值及删除cookie用法实例
2016/04/15 Javascript
三种方式实现瀑布流布局
2017/02/10 Javascript
Vue项目中使用Vux的安装过程
2018/05/01 Javascript
深入浅析Vue.js计算属性和侦听器
2018/05/05 Javascript
Angularjs中date过滤器失效的问题及解决方法
2018/07/06 Javascript
深入koa-bodyparser原理解析
2019/01/16 Javascript
微信小程序拍照和摄像功能实现方法示例
2019/02/01 Javascript
基于Proxy的小程序状态管理实现
2019/06/14 Javascript
vue实现在线学生录入系统
2020/05/30 Javascript
Vue中的nextTick作用和几个简单的使用场景
2021/01/25 Vue.js
在Python中使用SimpleParse模块进行解析的教程
2015/04/11 Python
Python中的descriptor描述器简明使用指南
2016/06/02 Python
Python3使用PyQt5制作简单的画板/手写板实例
2017/10/19 Python
解决python爬虫中有中文的url问题
2018/05/11 Python
python3判断url链接是否为404的方法
2018/08/10 Python
Python3多线程版TCP端口扫描器
2019/08/31 Python
使用python matplotlib 画图导入到word中如何保证分辨率
2020/04/16 Python
numpy中生成随机数的几种常用函数(小结)
2020/08/18 Python
CSS3实现简易版的刮刮乐效果
2016/09/27 HTML / CSS
中国旅游网站:途牛旅游网
2019/09/29 全球购物
小学学习雷锋活动总结
2014/07/03 职场文书
捐书倡议书
2014/08/29 职场文书
2014年小学工作总结
2014/11/26 职场文书
2014年工商所工作总结
2014/12/09 职场文书
骨干教师事迹材料
2014/12/17 职场文书
掌握一个领域知识,高效学习必备方法
2019/08/08 职场文书
教你win10系统中APPCRASH事件问题解决方法
2022/07/15 数码科技