php中看实例学正则表达式


Posted in PHP onDecember 25, 2006

看实例学正则表达式   
首先,让我们看看两个特别的字符:'^' 和 ‘$' 他们是分别用来匹配字符串的开始和结束,一下分别举例说明: 

首先,让我们看看两个特别的字符:'^' 和 ‘$' 他们是分别用来匹配字符串的开始和结束,一下分别举例说明: 

"^The": 匹配以 "The"开头的字符串; 

"of despair$": 匹配以 "of despair" 结尾的字符串; 

"^abc$": 匹配以abc开头和以abc结尾的字符串,实际上是只有abc与之匹配;

"notice": 匹配包含notice的字符串;

你可以看见如果你没有用我们提到的两个字符(最后一个例子),就是说 模式(正则表达式) 可以出现在被检验字符串的任何地方,你没有把他锁定到两边。

这里还有几个字符 '*', '+',和 '?', 他们用来表示一个字符可以出现的次数或者顺序. 他们分别表示:"zero or more", "one or more", and "zero or one." 这里是一些例子: 

"ab*": 匹配字符串a和0个或者更多b组成的字符串("a", "ab", "abbb", etc.); 

"ab+": 和上面一样,但最少有一个b ("ab", "abbb", etc.); 

"ab?":匹配0个或者一个b; 

"a?b+$": 匹配以一个或者0个a再加上一个以上的b结尾的字符串. 

你也可以在大括号里面限制字符出现的个数,比如 

"ab{2}": 匹配一个a后面跟两个b(一个也不能少)("abb"); 

"ab{2,}": 最少更两个b("abb", "abbbb", etc.); 

"ab{3,5}": 2-5个b("abbb", "abbbb", or "abbbbb"). 

你还要注意到你必须总是指定 (i.e, "{0,2}", not "{,2}").同样,你必须注意到, '*', '+', 和'?' 分别和一下三个范围标注是一样的,"{0,}", "{1,}", 和 "{0,1}"。 

现在把一定数量的字符放到小括号里,比如: 

"a(bc)*": 匹配 a 后面跟0个或者一个"bc"; 

"a(bc){1,5}": 一个到5个 "bc." 

还有一个字符 '│', 相当于OR 操作: 

"hi│hello": 匹配含有"hi" 或者 "hello" 的 字符串; 

"(b│cd)ef": 匹配含有 "bef" 或者 "cdef"的字符串; 

"(a│b)*c": 匹配含有这样 - 多个(包括0个)a或b,后面跟一个c的字符串 的字符串; 

一个点('.')可以代表所有的 单一字符: 

"a.[0-9]": 一个a跟一个字符再跟一个数字的 (含有这样一个字符串的字符串将被匹配,以后省略此括号) 

"^.{3}$": 以三个字符结尾.中括号括住的内容只匹配一个 单一的字符 

"[ab]": 匹配单个的 a 或者 b ( 和 "a│b" 一样); 

"[a-d]": 匹配'a' 到'd'的单个字符 (和"a│b│c│d" 还有 "[abcd]"效果一样); 

"^[a-zA-Z]": 匹配以字母开头的字符串 

"[0-9]%": 匹配含有 形如 x% 的字符串 

",[a-zA-Z0-9]$": 匹配以逗号在加一个数字或字母结尾的字符串 

你也可以把你不想要得字符列在中括号里,你只需要在总括号里面使用'^' 作为开头 (i.e., "%[^a-zA-Z]%" 匹配含有 两个百分号里面有一个非字母 的字符串). 

为了能够解释,但"^.[$()│*+?{"作为有特殊意义的字符的时候,你必须在这些字 符面前加'', 还有在php3中你应该避免在模式的最前面使用, 比如说,正则表达式 "($│?[0-9]+" 应该这样调用 ereg("($│?[0-9]+", $str) (不知道php4是不是一样) 

不要忘记在中括号里面的字符是这条规路的例外—在中括号里面, 所有的特殊字符,包括(''), 都将失去他们的特殊性质(i.e., "[*+?{}.]"匹配含有这些字符的字符串). 还有,正如regx的手册告诉我们: "如果列表里含有 ']', 最好把它作为列表里的第一个字符(可能跟在'^'后面). 如果含有'-', 最好把它放在最前面或者最后面, or 或者一个范围的第二个结束点(i.e. [a-d-0-9]中间的‘-'将有效. 

为了完整, 我应该涉及到 collating sequences, character classes, 同埋 equivalence classes. 但我在这些方面不想讲的太详细, 这些在下面的文章仲都不需要涉及到. 你们可以在regex man pages 那里得到更多消息. 

如何构建一个模式来匹配 货币数量 的输入 

好了,现在我们要用我们所学的来干一些有用的事:构建一个匹配模式去检查输入的信息是否为一 个表示money的数字。我们认为一个表示money的数量有四种方式: "10000.00" 和 "10,000.00",或者没有小数部分, "10000" and "10,000". 现在让我们开始构建这个匹配模式: 

^[1-9][0-9]*$ 

这是所变量必须以非0的数字开头.但这也意味着 单一的 "0" 也不能通过测试. 以下是解决的方法: 

^(0│[1-9][0-9]*)$ 

"只有0和不以0开头的数字与之匹配",我们也可以允许一个负号再数字之前: 

^(0│-?[1-9][0-9]*)$ 

这就是: "0 或者 一个以0开头可能有一个负号在前面的数字." 好了, 好了现在让我们别那么严谨,允许以0开头.现在让我们放弃 负号 , 因为我们在表示钱币的时候并不需要用到. 我们现在指定 模式 用来匹配小数部分: 

^[0-9]+(.[0-9]+)?$ 

这暗示匹配的字符串必须最少以一个阿拉伯数字开头. 但是注意,在上面模式中 "10." 是不匹配的, 只有 "10" 和 "10.2" 才可以. (你知道为什么吗) 

^[0-9]+(.[0-9]{2})?$ 

我们上面指定小数点后面必须有两位小数.如果你认为这样太苛刻,你可以改成: 

^[0-9]+(.[0-9]{1,2})?$ 

这将允许小数点后面有一到两个字符. 现在我们加上用来增加可读性的逗号(每隔三位), 我们可以这样表示: 

^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$ 

不要忘记加号 '+' 可以被乘号 '*' 替代如果你想允许空白字符串被输入话 (为什么?). 也不要忘记反斜杆 '' 在php字符串中可能会出现错误 (很普遍的错误). 现在,我们已经可以确认字符串了, 我们现在把所有逗号都去掉 str_replace(",", "", $money) 然后在把类型看成 double然后我们就可以通过他做数学计算了. 

构造检查email的正则表达式 

让我们继续讨论怎么验证一个email地址. 在一个完整的email地址中有三个部分: POP3 用户名 (在 '@' 左边的一切), '@', 服务器名(就是剩下那部分). 用户名可以含有大小写字母阿拉伯数字,句号 ('.'), 减号('-'), and 下划线 ('_'). 服务器名字也是符合这个规则,当然下划线除外. 

现在, 用户名的开始和结束都不能是句点. 服务器也是这样. 还有你不能有两个连续的句点他们之间至少存在一个字符,好现在我们来看一下怎么为用户名写一个匹配模式: 

^[_a-zA-Z0-9-]+$ 

现在还不能允许句号的存在. 我们把它加上: 

^[_a-zA-Z0-9-]+(.[_a-zA-Z0-9-]+)*$ 

上面的意思就是说: "以至少一个规范字符(除.意外)开头,后面跟着0个或者多个以点开始的字符串." 

简单化一点, 我们可以用 eregi()取代 ereg().eregi()对大小写不敏感, 我们就不需要指定两个范围 "a-z" 和 "A-Z" ? 只需要指定一个就可以了: 

^[_a-z0-9-]+(.[_a-z0-9-]+)*$ 

后面的服务器名字也是一样,但要去掉下划线: 

^[a-z0-9-]+(.[a-z0-9-]+)*$ 

Done. 现在只需要用”@”把两部分连接: 

^[_a-z0-9-]+(.[_a-z0-9-]+)*@[a-z0-9-]+(.[a-z0-9-]+)*$ 

这就是完整的email认证匹配模式了,只需要调用 

eregi(‘^[_a-z0-9-]+(.[_a-z0-9-]+)*@[a-z0-9-]+(.[a-z0-9-]+)*$ ',$eamil) 

就可以得到是否为email了。

正则表达式的其他用法 

提取字符串 

ereg() and eregi() 有一个特性是允许用户通过正则表达式去提取字符串的一部分(具体用法你可以阅读手册). 比如说,我们想从 path/URL 提取文件名 ? 下面的代码就是你需要: 

ereg("([^/]*)$", $pathOrUrl, $regs); 

echo $regs[1]; 

高级的代换 

ereg_replace() 和 eregi_replace()也是非常有用的: 假如我们想把所有的间隔负号都替换成逗号: 

ereg_replace("[ ]+", ",", trim($str)); 

PHP 相关文章推荐
PHP 函数执行效率的小比较
Oct 17 PHP
WampServer下安装多个版本的PHP、mysql、apache图文教程
Jan 07 PHP
php计算数组相同值出现次数的代码(array_count_values)
Jan 20 PHP
PHP开发中常用的十个代码样例
Feb 02 PHP
PHP的Laravel框架中使用消息队列queue及异步队列的方法
Mar 21 PHP
php使用curl并发减少后端访问时间的方法分析
May 12 PHP
PHP入门教程之正则表达式基本用法实例详解(正则匹配,搜索,分割等)
Sep 11 PHP
php面向对象重点知识分享
Sep 27 PHP
PHP发送邮件确认验证注册功能示例【修改别人邮件类】
Nov 09 PHP
详解no input file specified 三种解决方法
Nov 29 PHP
PHP 实现 WebSocket 协议原理与应用详解
Apr 22 PHP
PHP设计模式(三)建造者模式Builder实例详解【创建型】
May 02 PHP
谈谈新手如何学习PHP
Dec 23 #PHP
服务器端解压缩zip的脚本
Dec 22 #PHP
Windows2003 下 MySQL 数据库每天自动备份
Dec 21 #PHP
剖析 PHP 中的输出缓冲
Dec 21 #PHP
PHP 的几个配置文件函数
Dec 21 #PHP
使用 MySQL 开始 PHP 会话
Dec 21 #PHP
PHP 编程请选择正确的文本编辑软件
Dec 21 #PHP
You might like
PHP HTML代码串截取代码
2008/12/29 PHP
字母顺序颠倒而单词顺序不变的php代码
2010/08/08 PHP
PHP 异步执行方法,模拟多线程的应用分析
2013/06/03 PHP
PHP base64编码后解码乱码的解决办法
2014/06/19 PHP
PHP多进程简单实例小结
2019/11/09 PHP
jquery 插件学习(五)
2012/08/06 Javascript
Angularjs中使用Filters详解
2016/03/11 Javascript
jQuery+CSS实现简单切换菜单示例
2016/07/27 Javascript
js实现3D图片展示效果
2017/03/09 Javascript
JavaScript数据结构之双向链表和双向循环链表的实现
2017/11/28 Javascript
JS代码实现电脑配置检测功能
2018/03/21 Javascript
浅谈从React渲染流程分析Diff算法
2018/09/08 Javascript
Vue表单输入绑定的示例代码
2018/11/01 Javascript
vue项目移动端实现ip输入框问题
2019/03/19 Javascript
记一次Vue.js混入mixin的使用(分权限管理页面)
2019/04/17 Javascript
Node.js API详解之 timer模块用法实例分析
2020/05/07 Javascript
vue+animation实现翻页动画
2020/06/29 Javascript
[42:32]Secret vs Optic 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
Python黑魔法Descriptor描述符的实例解析
2016/06/02 Python
基于Python闭包及其作用域详解
2017/08/28 Python
Python进程,多进程,获取进程id,给子进程传递参数操作示例
2019/10/11 Python
python requests抓取one推送文字和图片代码实例
2019/11/04 Python
Python3 实现减少可调用对象的参数个数
2019/12/20 Python
Python接口自动化测试框架运行原理及流程
2020/11/30 Python
纽约通行卡:The New York Pass(免费游览纽约90多个景点)
2017/07/29 全球购物
马耳他航空公司官方网站:Air Malta
2019/05/15 全球购物
Hammitt官网:设计师手袋
2020/05/23 全球购物
Servlet的生命周期
2013/08/25 面试题
大一新生军训时的自我评价分享
2013/12/05 职场文书
2014年社区植树节活动方案
2014/02/28 职场文书
采购意向书范本
2014/03/31 职场文书
个人求职信范文
2014/05/24 职场文书
商场周年庆活动方案
2014/08/19 职场文书
2014年幼师工作总结
2014/11/22 职场文书
2016年优秀少先队员事迹材料
2016/02/26 职场文书
Python下opencv库的安装过程及问题汇总
2021/06/11 Python