PHP中的正规表达式(一)


Posted in PHP onOctober 09, 2006

PHP中的正规表达式(一)
Hunte 2000年4月14日

PHP继承*NIX的一贯传统,完全支持正规表达式的处理。正规表达式提供了一种高级的,但不直观的字符串匹配和处理的方法。用过PERL的正规表达式的朋友都知道,正规表达式的功能非常强大,但学起来不是那么容易。
比如:

^.+@.+\\..+$

这段有效却难以理解的代码足够使一些程序员头痛(我就是)或者让他们放弃使用正规表达式。相信当你读完这个教程后,就可以理解这段代码的含义了。

基本模式匹配

一切从最基本的开始。模式,是正规表达式最基本的元素,它们是一组描述字符串特征的字符。模式可以很简单,由普通的字符串组成,也可以非常复杂,往往用特殊的字符表示一个范围内的字符、重复出现,或表示上下文。例如:

^once

这个模式包含一个特殊的字符^,表示该模式只匹配那些以once开头的字符串。例如该模式与字符串"once upon a time"匹配,与"There once was a man from NewYork"不匹配。正如如^符号表示开头一样,$符号用来匹配那些以给定模式结尾的字符串。

bucket$

这个模式与"Who kept all of this cash in a bucket"匹配,与"buckets"不匹配。字符^和$同时使用时,表示精确匹配(字符串与模式一样)。例如:

^bucket$

只匹配字符串"bucket"。如果一个模式不包括^和$,那么它与任何包含该模式的字符串匹配。例如:模式

once

与字符串

There once was a man from NewYork
Who kept all of his cash in a bucket.

是匹配的。

在该模式中的字母(o-n-c-e)是字面的字符,也就是说,他们表示该字母本身,数字也是一样的。其他一些稍微复杂的字符,如标点符号和白字符(空格、制表符等),要用到转义序列。所有的转义序列都用反斜杠(\)打头。制表符的转义序列是:\t。所以如果我们要检测一个字符串是否以制表符开头,可以用这个模式:

^\t

类似的,用\n表示“新行”,\r表示回车。其他的特殊符号,可以用在前面加上反斜杠,如反斜杠本身用\\表示,句号.用\.表示,以此类推。

字符簇

在INTERNET的程序中,正规表达式通常用来验证用户的输入。当用户提交一个FORM以后,要判断输入的电话号码、地址、EMAIL地址、信用卡号码等是否有效,用普通的基于字面的字符是不够的。

所以要用一种更自由的描述我们要的模式的办法,它就是字符簇。要建立一个表示所有元音字符的字符簇,就把所有的元音字符放在一个方括号里:

[AaEeIiOoUu]

这个模式与任何元音字符匹配,但只能表示一个字符。用连字号可以表示一个字符的范围,如:

[a-z] //匹配所有的小写字母
[A-Z] //匹配所有的大写字母
[a-zA-Z] //匹配所有的字母
[0-9] //匹配所有的数字
[0-9\.\-] //匹配所有的数字,句号和减号
[ \f\r\t\n] //匹配所有的白字符

同样的,这些也只表示一个字符,这是一个非常重要的。如果要匹配一个由一个小写字母和一位数字组成的字符串,比如"z2"、"t6"或"g7",但不是"ab2"、"r2d3" 或"b52"的话,用这个模式:

^[a-z][0-9]$

尽管[a-z]代表26个字母的范围,但在这里它只能与第一个字符是小写字母的字符串匹配。

前面曾经提到^表示字符串的开头,但它还有另外一个含义。当在一组方括号里使用^是,它表示“非”或“排除”的意思,常常用来剔除某个字符。还用前面的例子,我们要求第一个字符不能是数字:

^[^0-9][0-9]$

这个模式与"&5"、"g7"及"-2"是匹配的,但与"12"、"66"是不匹配的。下面是几个排除特定字符的例子:

[^a-z] //除了小写字母以外的所有字符
[^\\\/\^] //除了(\)(/)(^)之外的所有字符
[^\"\'] //除了双引号(")和单引号(')之外的所有字符

特殊字符"." (点,句号)在正规表达式中用来表示除了“新行”之外的所有字符。所以模式"^.5$"与任何两个字符的、以数字5结尾和以其他非“新行”字符开头的字符串匹配。模式"."可以匹配任何字符串,除了空串和只包括一个“新行”的字符串。

PHP的正规表达式有一些内置的通用字符簇,列表如下:

字符簇 含义
[[:alpha:]] 任何字母
[[:digit:]] 任何数字
[[:alnum:]] 任何字母和数字
[[:space:]] 任何白字符
[[:upper:]] 任何大写字母
[[:lower:]] 任何小写字母
[[:punct:]] 任何标点符号
[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]

PHP 相关文章推荐
一个程序下载的管理程序(四)
Oct 09 PHP
php 无限极分类
Mar 27 PHP
PHP mail 通过Windows的SMTP发送邮件失败的解决方案
May 27 PHP
基于session_unset与session_destroy的区别详解
Jun 03 PHP
php中sql注入漏洞示例 sql注入漏洞修复
Jan 24 PHP
php调用nginx的mod_zip模块打包ZIP文件
Jun 11 PHP
PHP跨平台获取服务器IP地址自定义函数分享
Dec 29 PHP
php生成验证码函数
Oct 20 PHP
thinkphp实现163、QQ邮箱收发邮件的方法
Dec 18 PHP
php图像验证码生成代码
Jun 08 PHP
PHP使用文件锁解决高并发问题示例
Mar 29 PHP
网站被恶意镜像怎么办 php一段代码轻松搞定(全面版)
Oct 23 PHP
PHP中的正规表达式(二)
Oct 09 #PHP
smtp邮件发送一例
Oct 09 #PHP
图片存储与浏览一例(Linux+Apache+PHP+MySQL)
Oct 09 #PHP
PHP+javascript液晶时钟
Oct 09 #PHP
一个分页的论坛
Oct 09 #PHP
一个简易需要注册的留言版程序
Oct 09 #PHP
使用数据库保存session的方法
Oct 09 #PHP
You might like
PHP 抓取网页图片并且另存为的实现代码
2010/03/24 PHP
PHP字符编码问题之GB2312 VS UTF-8解决方法
2011/06/23 PHP
PHP执行linux命令常用函数汇总
2016/02/02 PHP
Symfony核心类概述
2016/03/17 PHP
鼠标焦点离开文本框时验证的js代码
2013/07/19 Javascript
浅析Js中的单引号与双引号问题
2013/11/06 Javascript
node.js中的fs.close方法使用说明
2014/12/17 Javascript
Javascript基础教程之数据类型 (数值 Number)
2015/01/18 Javascript
jQuery遍历DOM节点操作之filter()方法详解
2016/04/14 Javascript
AngularJS中的Promise详细介绍及实例代码
2016/12/13 Javascript
微信小程序 视图容器组件的详解及实例代码
2017/01/19 Javascript
Javascript之图片的延迟加载的实例详解
2017/07/24 Javascript
使用JavaScript进行表单校验功能
2017/08/01 Javascript
彻底理解js面向对象之继承
2018/02/04 Javascript
vue this.reload 方法 配置
2018/09/12 Javascript
微信小程序顶部导航栏滑动tab效果
2019/01/28 Javascript
详解vuex之store源码简单解析
2019/06/13 Javascript
JavaScript 作用域实例分析
2019/10/02 Javascript
[01:35]2018完美盛典章节片——共竞
2018/12/17 DOTA
python中函数传参详解
2016/07/03 Python
在win和Linux系统中python命令行运行的不同
2016/07/03 Python
[原创]使用豆瓣提供的国内pypi源
2017/07/02 Python
Python各种扩展名区别点整理
2020/02/27 Python
Python实现屏幕录制功能的代码
2020/03/02 Python
在Matplotlib图中插入LaTex公式实例
2020/04/17 Python
python如何删除文件、目录
2020/06/23 Python
python开发入门——列表生成式
2020/09/03 Python
css3实现书本翻页效果的示例代码
2021/03/08 HTML / CSS
国外平面设计素材网站:The Hungry JPEG
2017/03/28 全球购物
Linux如何命名文件--使用文件名时应注意
2012/01/22 面试题
文明礼仪事迹材料
2014/01/09 职场文书
汉语言文学职业规划
2014/02/14 职场文书
信息与计算科学专业推荐信
2014/02/23 职场文书
开会通知短信大全
2015/04/20 职场文书
2015年人力资源部工作总结
2015/04/30 职场文书
Mysql外键约束的创建与删除的使用
2022/03/03 MySQL