编程 Python

python的正则表达式re模块的常用方法

Posted in Python onMarch 09, 2013

1.re的简介
使用python的re模块，尽管不能满足所有复杂的匹配情况，但足够在绝大多数情况下能够有效地实现对复杂字符串的分析并提取出相关信息。python 会将正则表达式转化为字节码，利用 C 语言的匹配引擎进行深度优先的匹配。

import re 
print re.__doc__

可以查询re模块的功能信息，下面会结合几个例子说明。

2.re的正则表达式语法

正则表达式语法表如下：

语法	意义	说明
"."	任意字符
"^"	字符串开始	'^hello'匹配'helloworld'而不匹配'aaaahellobbb'
"$"	字符串结尾	与上同理
"*"	0 个或多个字符（贪婪匹配）	匹配chinaunix
"+"	1 个或多个字符（贪婪匹配）	与上同理
"?"	0 个或多个字符（贪婪匹配）	与上同理
*?,+?,??	以上三个取第一个匹配结果（非贪婪匹配）	匹配
{m,n}	对于前一个字符重复m到n次，{m}亦可	a{6}匹配6个a、a{2,4}匹配2到4个a
{m,n}?	对于前一个字符重复m到n次，并取尽可能少	‘aaaaaa'中a{2,4}只会匹配2个
"\\"	特殊字符转义或者特殊序列
[]	表示一个字符集	[0-9]、[a-z]、[A-Z]、[^0]
"\|"	或	A\|B,或运算
(...)	匹配括号中任意表达式
(?#...)	注释，可忽略
(?=...)	Matches if ... matches next, but doesn't consume the string.	'(?=test)' 在hellotest中匹配hello
(?!...)	Matches if ... doesn't match next.	'(?!=test)' 若hello后面不为test，匹配hello
(?	Matches if preceded by ... (must be fixed length).	'(?
(?	Matches if not preceded by ... (must be fixed length).	'(?

正则表达式特殊序列表如下：

特殊序列符号	意义
\A	只在字符串开始进行匹配
\Z	只在字符串结尾进行匹配
\b	匹配位于开始或结尾的空字符串
\B	匹配不位于开始或结尾的空字符串
\d	相当于[0-9]
\D	相当于[^0-9]
\s	匹配任意空白字符:[\t\n\r\r\v]
\S	匹配任意非空白字符:[^\t\n\r\r\v]
\w	匹配任意数字和字母:[a-zA-Z0-9]
\W	匹配任意非数字和字母:[^a-zA-Z0-9]

3.re的主要功能函数

常用的功能函数包括：compile、search、match、split、findall（finditer）、sub（subn）
compile
re.compile(pattern[, flags])
作用：把正则表达式语法转化成正则表达式对象
flags定义包括：
re.I：忽略大小写
re.L：表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M：多行模式
re.S：' . '并且包括换行符在内的任意字符（注意：' . '不包括换行符）
re.U：表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库

search
re.search(pattern, string[, flags])
search (string[, pos[, endpos]])
作用：在字符串中查找匹配正则表达式模式的位置，返回 MatchObject 的实例，如果没有找到匹配的位置，则返回 None。

match
re.match(pattern, string[, flags])
match(string[, pos[, endpos]])
作用：match() 函数只在字符串的开始位置尝试匹配正则表达式，也就是只报告从位置 0 开始的匹配情况，而 search() 函数是扫描整个字符串来查找匹配。如果想要搜索整个字符串来寻找匹配，应当用 search()。

下面是几个例子：
例：最基本的用法，通过re.RegexObject对象调用

#!/usr/bin/env python
import re
r1 = re.compile(r'world')
if r1.match('helloworld'):
    print 'match succeeds'
else:
    print 'match fails'
if r1.search('helloworld'):
    print 'search succeeds'
else:
    print 'search fails'

说明一下：r是raw(原始)的意思。因为在表示字符串中有一些转义符，如表示回车'\n'。如果要表示\表需要写为'\\'。但如果我就是需要表示一个'\'+'n'，不用r方式要写为:'\\n'。但使用r方式则为r'\n'这样清晰多了。

例：设置flag

#r2 = re.compile(r'n$', re.S)
#r2 = re.compile('\n$', re.S)
r2 = re.compile('World$', re.I)
if r2.search('helloworld\n'):
    print 'search succeeds'
else:
    print 'search fails'

例：直接调用

if re.search(r'abc','helloaaabcdworldn'):
    print 'search succeeds'
else:
    print 'search fails'

split
re.split(pattern, string[, maxsplit=0, flags=0])
split(string[, maxsplit=0])
作用：可以将字符串匹配正则表达式的部分割开并返回一个列表
例：简单分析ip

#!/usr/bin/env python
import re
r1 = re.compile('W+')
print r1.split('192.168.1.1')
print re.split('(W+)', '192.168.1.1')
print re.split('(W+)', '192.168.1.1', 1)

结果如下：
['192', '168', '1', '1']
['192', '.', '168', '.', '1', '.', '1']
['192', '.', '168.1.1']

findall
re.findall(pattern, string[, flags])
findall(string[, pos[, endpos]])
作用：在字符串中找到正则表达式所匹配的所有子串，并组成一个列表返回
例：查找[]包括的内容（贪婪和非贪婪查找）

#!/usr/bin/env python
import re
r1 = re.compile('([.*])')
print re.findall(r1, "hello[hi]heldfsdsf[iwonder]lo")
r1 = re.compile('([.*?])')
print re.findall(r1, "hello[hi]heldfsdsf[iwonder]lo")
print re.findall('[0-9]{2}',"fdskfj1323jfkdj")
print re.findall('([0-9][a-z])',"fdskfj1323jfkdj")
print re.findall('(?=www)',"afdsfwwwfkdjfsdfsdwww")
print re.findall('(?<=www)',"afdsfwwwfkdjfsdfsdwww")

finditer
re.finditer(pattern, string[, flags])
finditer(string[, pos[, endpos]])
说明：和 findall 类似，在字符串中找到正则表达式所匹配的所有子串，并组成一个迭代器返回。同样 RegexObject 有：

sub
re.sub(pattern, repl, string[, count, flags])
sub(repl, string[, count=0])
说明：在字符串 string 中找到匹配正则表达式 pattern 的所有子串，用另一个字符串 repl 进行替换。如果没有找到匹配 pattern 的串，则返回未被修改的 string。Repl 既可以是字符串也可以是一个函数。
例：

#!/usr/bin/env python
import re
p = re.compile('(one|two|three)')
print p.sub('num', 'one word two words three words apple', 2)

subn
re.subn(pattern, repl, string[, count, flags])
subn(repl, string[, count=0])

说明：该函数的功能和 sub() 相同，但它还返回新的字符串以及替换的次数。同样 RegexObject 有：

python的正则表达式re模块的常用方法

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Bottle框架中的装饰器类和描述符应用详解

Oct 28 Python

django反向解析URL和URL命名空间的方法

Jun 05 Python

解决Python中list里的中文输出到html模板里的问题

Dec 17 Python

python查找重复图片并删除（图片去重）

Jul 16 Python

TensorFlow实现checkpoint文件转换为pb文件

Feb 10 Python

python随机模块random的22种函数(小结)

May 15 Python

解决Keras 中加入lambda层无法正常载入模型问题

Jun 16 Python

Android Q之气泡弹窗的实现示例

Jun 23 Python

利用PyTorch实现VGG16教程

Jun 24 Python

keras 自定义loss层+接受输入实例

Jun 28 Python

Python 批量下载阴阳师网站壁纸

May 19 Python

python 实现体质指数BMI计算

May 26 Python

Python语言编写电脑时间自动同步小工具

Mar 08 #Python

py2exe 编译ico图标的代码

Mar 08 #Python

python中wx将图标显示在右下角的脚本代码

Mar 08 #Python

python中关于时间和日期函数的常用计算总结(time和datatime)

Mar 08 #Python

python中关于日期时间处理的问答集锦

Mar 08 #Python

python局部赋值的规则

Mar 07 #Python

Python 用户登录验证的小例子

Mar 06 #Python

You might like

探讨:如何编写PHP扩展

2013/06/13 PHP

微信支付扫码支付php版

2016/07/22 PHP

PHP ADODB生成下拉列表框功能示例

2018/05/29 PHP

几个高效，简洁的字符处理函数

2007/04/12 Javascript

Document对象内容集合(比较全)

2010/09/06 Javascript

正则表达式搭配js轻松处理json文本方便而老古

2013/02/17 Javascript

jQuery封装的获取Url中的Get参数示例

2013/11/26 Javascript

js实现的点击div区域外隐藏div区域

2014/06/30 Javascript

详解jquery中$.ajax方法提交表单

2014/11/03 Javascript

jQuery实现带延迟效果的滑动菜单代码

2015/09/02 Javascript

浅析如何利用angular结合translate为项目实现国际化

2016/12/08 Javascript

jQuery简单绑定单个事件的方法示例

2017/06/10 jQuery

JavaScript实现兼容IE6的收起折叠与展开效果实例

2017/09/20 Javascript

webpack4 入门最简单的例子介绍

2018/09/05 Javascript

微信小程序云开发之云函数详解

2019/05/16 Javascript

Vue 一键清空表单的实现方法

2020/02/07 Javascript

JavaScript对象字面量和构造函数原理与用法详解

2020/04/18 Javascript

Javascript confirm多种使用方法解析

2020/09/25 Javascript

详解node.js创建一个web服务器(Server)的详细步骤

2021/01/15 Javascript

[34:10]Secret vs VG 2019国际邀请赛淘汰赛败者组 BO3 第二场 8.24

2019/09/10 DOTA

Python内置函数之filter map reduce介绍

2014/11/30 Python

python调用Matplotlib绘制分布点并且添加标签

2018/05/31 Python

Python GUI布局尺寸适配方法

2018/10/11 Python

python 3.7.4 安装 opencv的教程

2019/10/10 Python

python实现树的深度优先遍历与广度优先遍历详解

2019/10/26 Python

Melijoe时尚童装德国官网：Melijoe德国

2016/09/03 全球购物

澳大利亚第一的设计师礼服租赁网站：GlamCorner

2017/08/13 全球购物

Asics日本官网：鬼冢八喜郎创立的跑鞋运动品牌

2017/10/18 全球购物

Vrbo西班牙：预订您的度假公寓（公寓、乡村房屋…）

2020/04/27 全球购物

学习雷锋倡议书

2014/04/15 职场文书

供货协议书

2014/04/22 职场文书

培训研修方案

2014/06/06 职场文书

工伤事故处理协议书怎么写

2014/10/15 职场文书

情人节活动总结范文

2015/02/05 职场文书

Python批量将csv文件转化成xml文件的实例

2021/05/10 Python

基于Python实现一个春节倒计时脚本

2022/01/22 Python