如何在PHP中使用正则表达式进行查找替换


Posted in PHP onJune 13, 2013

1. preg_match — 执行一个正则表达式匹配
int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )
搜索subject与pattern给定的正则表达式的一个匹配.
pattern:
要搜索的模式,字符串类型。
subject :
输入字符串。
matches:
如果提供了参数matches,它将被填充为搜索结果。 $matches[0]将包含完整模式匹配到的文本, $matches[1]将包含第一个捕获子组匹配到的文本,以此类推。
flags:
flags可以被设置为以下标记值:PREG_OFFSET_CAPTURE 如果传递了这个标记,对于每一个出现的匹配返回时会附加字符串偏移量(相对于目标字符串的)。 注意:这会改变填充到matches参数的数组,使其每个元素成为一个由 第0个元素是匹配到的字符串,第1个元素是该匹配字符串 在目标字符串subject中的偏移量。
offset:
通常,搜索从目标字符串的开始位置开始。可选参数 offset 用于 指定从目标字符串的某个未知开始搜索(单位是字节)。
返回值:
preg_match()返回 pattern 的匹配次数。 它的值将是0次(不匹配)或1次,因为 preg_match()在第一次匹配后 将会停止搜索。 preg_match_all()不同于此,它会一直搜索subject直到到达结尾。 如果发生错误 preg_match()返回 FALSE。
示例:

<?php
/*
 *模式分隔符后的"i"标记这是一个大小写不敏感的搜索
 *将会输出:1
 */
echo preg_match("/,\s*(php)/i", "In my point, PHP is the web scripting language of choice.");
echo "<br/>"."\n";
/*
 *将会输出:Array([0]=>, PHP [1]=>PHP) 
 */
$matches = array();
preg_match("/,\s*(php)/i", "In my point, PHP is the web scripting language of choice. I love php", $matches);
print_r($matches);
echo "<br/>"."\n";
/*
 *将会输出:Array([0]=>Array([0]=>, PHP [1]=>11) [1]=>Array([0]=>PHP [1]=>13)) 
 */
preg_match("/,\s*(php)/i", "In my point, PHP is the web scripting language of choice. I love php", $matches, PREG_OFFSET_CAPTURE);
print_r($matches);
echo "<br/>"."\n";
/*
 *将会输出:Array([0]=>Array([0]=>e php [1]=63) [1]=>Array([0]=>php [1]=>65)) 
 */
preg_match("/[,a-z]?\s*(php)/i", "In my point, PHP is the web scripting language of choice. I love php", $matches, PREG_OFFSET_CAPTURE, 28);
print_r($matches);
echo "<br/>"."\n";
?> 

2.preg_match_all — 执行一个全局正则表达式匹配
int preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags = PREG_PATTERN_ORDER [, int $offset = 0 ]]] )
搜索subject中所有匹配pattern给定正则表达式 的匹配结果并且将它们以flag指定顺序输出到matches中. 在第一个匹配找到后, 子序列继续从最后一次匹配位置搜索.
pattern:
要搜索的模式,字符串形式。
subject :
输入字符串。
matches:
多维数组,作为输出参数输出所有匹配结果, 数组排序通过flags指定。
flags:
可以结合下面标记使用(注意不能同时使用PREG_PATTERN_ORDER和PREG_SET_ORDER),如果没有给定排序标记,假定设置为PREG_PATTERN_ORDER:
PREG_PATTERN_ORDER:
结果排序为$matches[0]保存完整模式的所有匹配, $matches[1]保存第一个子组的所有匹配,以此类推。
PREG_SET_ORDER:
结果排序为$matches[0]包含第一次匹配得到的所有匹配(包含子组), $matches[1]是包含第二次匹配到的所有匹配(包含子组)的数组,以此类推。
PREG_OFFSET_CAPTURE:
如果这个标记被传递,每个发现的匹配返回时会增加它相对目标字符串的偏移量。 注意这会改变matches中的每一个匹配结果字符串元素,使其 成为一个第0个元素为 匹配结果字符串,第1个元素为 匹配结果字符串在subject中的偏移量。
返回值:
返回完整匹配次数(可能是0),或者如果发生错误返回FALSE。
示例:
<?php
/*
 *将会输出:2
 */
echo preg_match_all("/php/i", "In my point, PHP is the web scripting language of choice. I love php", $matches);
echo "<br/>"."\n";
/*
 *将会输出:Array([0]=>, PHP [1]=>PHP)  
 */
$matches = array();
preg_match("/[,a-z]?\s*(php)/i", "In my point, PHP is the web scripting language of choice. I love php", $matches);
print_r($matches);
echo "<br/>"."\n";
/*
 *将会输出:Array([0]=>Array([0]=>, PHP [1]=>e php) [1]=>Array([0]=>PHP [1]=>php))  
 */
$matches = array();
preg_match_all("/[,a-z]?\s*(php)/i", "In my point, PHP is the web scripting language of choice. I love php", $matches, PREG_PATTERN_ORDER);
print_r($matches);
echo "<br/>"."\n";
/*
 *将会输出:Array([0]=>Array([0]=>Array([0]=>, PHP [1]=>11) [1]=>Array([0]=>PHP [1]=>13)) [1]=>Array([0]=>Array([0]=>e php [1]=>63) [1]=>Array([0]=>php [1]=>65)))
 */
$matches = array();
preg_match_all("/[,a-z]?\s*(php)/i", "In my point, PHP is the web scripting language of choice. I love php", $matches, PREG_SET_ORDER|PREG_OFFSET_CAPTURE);
print_r($matches);
echo "<br/>"."\n";
/*
 *Array([0]=>Array([0]=>e php [1]=>63) [1]=>Array([0]=>php [1]=>65))
 */
$matches = array();
preg_match_all("/[,a-z]?\s*(php)/i", "In my point, PHP is the web scripting language of choice. I love php", $matches, PREG_SET_ORDER|PREG_OFFSET_CAPTURE, 28);
print_r($matches);
echo "<br/>"."\n";
?>

3.preg_split — 通过一个正则表达式分隔字符串
array preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] )
通过一个正则表达式分隔给定字符串.
pattern:
用于搜索的模式,字符串形式。
subject:
输入字符串
limit:
如果指定,将限制分隔得到的子串最多只有limit个,返回的最后一个 子串将包含所有剩余部分。limit值为-1, 0或null时都代表"不限制", 作为php的标准,你可以使用null跳过对flags的设置。
flags:
flags 可以是任何下面标记的组合(以位或运算 | 组合):
PREG_SPLIT_NO_EMPTY:
如果这个标记被设置, preg_split() 将进返回分隔后的非空部分。
PREG_SPLIT_DELIM_CAPTURE:
如果这个标记设置了,用于分隔的模式中的括号表达式将被捕获并返回。
PREG_SPLIT_OFFSET_CAPTURE:
如果这个标记被设置, 对于每一个出现的匹配返回时将会附加字符串偏移量. 注意:这将会改变返回数组中的每一个元素, 使其每个元素成为一个由第0个元素为分隔后的子串,第1个元素为该子串在subject中的偏移量组成的数组。
返回值:
返回一个使用 pattern 边界分隔 subject 后得到 的子串组成的数组。
示例:
<?php
/*
 *将会输出:
 *Array ( [0] => In my point, [1] => is the web scripting language of choice. I love [2] => ) 
 */
$matches = array();
print_r(preg_split("/php/i", "In my point, PHP is the web scripting language of choice. I love php"));
echo "<br/>"."\n";
/*
 *将会输出:
 *Array ( [0] => In my point, [1] => is the web scripting language of choice. I love php ) 
 */
$matches = array();
print_r(preg_split("/php/i", "In my point, PHP is the web scripting language of choice. I love php", 2));
echo "<br/>"."\n";
/*
 *将会输出:
 *Array ( [0] => In my point, [1] => is the web scripting language of choice. I love ) 
 */
$matches = array();
print_r(preg_split("/php/i", "In my point, PHP is the web scripting language of choice. I love php", -1, PREG_SPLIT_NO_EMPTY));
echo "<br/>"."\n";
?>

4.preg_quote — 转义正则表达式字符
string preg_quote ( string $str [, string $delimiter = NULL ] )
preg_quote()需要参数 str 并向其中 每个正则表达式语法中的字符前增加一个反斜线。 这通常用于你有一些运行时字符串 需要作为正则表达式进行匹配的时候。
正则表达式特殊字符有: . \ + * ? [ ^ ] $ ( ) { } = ! < > | : -
str:
输入字符串
delimiter:
如果指定了可选参数 delimiter,它也会被转义。这通常用于 转义PCRE函数使用的分隔符。 /是最通用的分隔符。
返回值:
返回转义后的字符串。
示例:
<?php
//在这个例子中,preg_quote($word) 用于保持星号原文涵义,使其不使用正则表达式中的特殊语义。
$textbody = "This book is *very* difficult to find.";
$word = "*very*";
$textbody = preg_replace ("/" . preg_quote($word) . "/", "<i>" . $word . "</i>", $textbody);
//将会输出This book is <i>*very*</i> difficult to find. 
echo htmlspecialchars($textbody);
?>

5.preg_grep — 返回匹配模式的数组条目
array preg_grep ( string $pattern , array $input [, int $flags = 0 ] )
返回给定数组input中与模式pattern匹配的元素组成的数组.
pattern:
要搜索的模式, 字符串形式.
input:
输入数组.
flags:
如果设置为PREG_GREP_INVERT, 这个函数返回输入数组中与 给定模式pattern不匹配的元素组成的数组.
返回值:
返回使用input中key做索引的数组.
示例:
<?php
$array = array("abc", "dd", "123", "123.22", "word123", "33.2", "0.22");
//返回所有包含浮点数的元素
//输出:Array ( [3] => 123.22 [5] => 33.2 [6] => 0.22 ) 
$fl_array = preg_grep("/^(\d+)?\.\d+$/", $array);
print_r($fl_array);
//返回所有包含浮点数的元素
//输出:Array ( [0] => abc [1] => dd [2] => 123 [4] => word123 ) 
$fl_array = preg_grep("/^(\d+)?\.\d+$/", $array, PREG_GREP_INVERT);
print_r($fl_array);
?>

6.preg_replace — 执行一个正则表达式的搜索和替换
mixed preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )
搜索subject中匹配pattern的部分, 以replacement进行替换。
pattern:
要搜索的模式。可以是一个字符串或字符串数组。 可以使用一些PCRE修饰符, 包括'e'(PREG_REPLACE_EVAL),可以为这个函数指定。
replacement:
用于替换的字符串或字符串数组。如果这个参数是一个字符串,并且pattern是一个数组,那么所有的模式都使用这个字符串进行替换。如果pattern和replacement都是数组,每个pattern使用replacement中对应的 元素进行替换。如果replacement中的元素比pattern中的少, 多出来的pattern使用空字符串进行替换。replacement中可以包含后向引用\\n或(php 4.0.4以上可用)$n,语法上首选后者。 每个 这样的引用将被匹配到的第n个捕获子组捕获到的文本替换。 n可以是0-99,\\0和$0代表完整的模式匹配文本。 捕获子组的序号计数方式为:代表捕获子组的左括号从左到右, 从1开始数。如果要在replacement中使用反斜线,必须使用4个("\\\\",译注:因为这首先是php的字符串,经过转义后,是两个,再经过 正则表达式引擎后才被认为是一个原文反斜线)。
当在替换模式下工作并且后向引用后面紧跟着需要是另外一个数字(比如:在一个匹配模式后紧接着增加一个原文数字), 不能使用\\1这样的语法来描述后向引用。比如, \\11将会使 preg_replace()不能理解你希望的是一个\\1后向引用紧跟一个原文1,还是 一个\\11后向引用后面不跟任何东西。 这种情况下解决方案是使用${1}1。
这创建了一个独立的$1后向引用, 一个独立的原文1。 当使用e修饰符时, 这个函数会转义一些字符(即:'、"、 \ 和 NULL) 然后进行后向引用替换。当这些完成后请确保后向引用解析完后没有单引号或 双引号引起的语法错误(比如: 'strlen(\'$1\')+strlen("$2")')。确保符合PHP的 字符串语法,并且符合eval语法。因为在完成替换后,
引擎会将结果字符串作为php代码使用eval方式进行评估并将返回值作为最终参与替换的字符串。
subject:
要进行搜索和替换的字符串或字符串数组。 如果subject是一个数组,搜索和替换回在subject的每一个元素上进行, 并且返回值也会是一个数组。
limit:
每个模式在每个subject上进行替换的最大次数。默认是 -1(无限)。
count:
如果指定,将会被填充为完成的替换次数。
返回值:
如果subject是一个数组, preg_replace()返回一个数组, 其他情况下返回一个字符串。 如果匹配被查找到,替换后的subject被返回,其他情况下 返回没有改变的 subject。如果发生错误,返回 NULL 。
示例:
使用后向引用紧跟数值原文:
<?php
$string = 'April 15, 2003';
/*
 *\w+字符重复一次或者多次
 *\d+数字重复一次或者多次
 *i忽略大小写
 */
$pattern = '/(\w+) (\d+), (\d+)/i';
/*
 *$0 完整的模式匹配文本
 *${1}1 第一个小括号中的模式匹配文本并且在后面加1
 *\\3 第三个小括号中的模式匹配文本
 */
$replacement = '$0:<br/> ${1}1,\\3';
echo preg_replace($pattern, $replacement, $string);
?>

preg_replace()中使用基于索引的数组:
$string = 'The quick brown fox jumped over the lazy dog.';
$patterns = array();
$patterns[0] = '/quick/';
$patterns[1] = '/brown/';
$patterns[2] = '/fox/';
$replacements = array();
$replacements[2] = 'bear';
$replacements[1] = 'black';
$replacements[0] = 'slow';
//会输出:The bear black slow jumped over the lazy dog.
echo preg_replace($patterns, $replacements, $string);
//对模式和替换内容按key进行排序我们可以得到期望的结果.
ksort($patterns);
ksort($replacements);
//会输出:The slow black bear jumped over the lazy dog.
echo preg_replace($patterns, $replacements, $string);

替换一些值:
<?php
$patterns = array ('/(19|20)(\d{2})-(\d{1,2})-(\d{1,2})/',
                   '/^\s*{(\w+)}\s*=/');
$replace = array ('\3/\4/\1\2', '$\1 =');
echo preg_replace($patterns, $replace, '{startDate} = 1999-5-27');
?>

使用修饰符'e':
<?php
$html_body = "<p><span>hello</span></p>";
//会输出:<P><SPAN>hello</SPAN></P> 
echo htmlspecialchars(preg_replace("/(<\/?)(\w+)([^>]*>)/e", 
             "'\\1'.strtoupper('\\2').'\\3'", 
             $html_body));
?>

剥离空白字符:
<?php
$str = 'foo   o';
$str = preg_replace('/\s\s+/', ' ', $str);
// 将会改变为'foo o'
echo $str;
?>

使用参数count:
<?php
$count = 0;
echo preg_replace(array('/\d/', '/\s/'), '*', 'xp 4 to', -1 , $count);
//等价于echo preg_replace('/\d|\s/', '', 'xp 4 to', -1 , $count);
echo $count; //3
?>

7.preg_replace_callback — 执行一个正则表达式搜索并且使用一个回调进行替换
mixed preg_replace_callback ( mixed $pattern , callable $callback , mixed $subject [, int $limit = -1 [, int &$count ]] )
这个函数的行为除了 可以指定一个 callback 替代 replacement 进行替换 字符串的计算,其他方面等同于 preg_replace()。
pattern:
要搜索的模式,可以使字符串或一个字符串数组。
callback:
一个回调函数,在每次需要替换时调用,调用时函数得到的参数是从subject中匹配到的结果。回调函数返回真正参与替换的字符串。
你可能经常会需要callback函数而 仅用于 preg_replace_callback()一个地方的调用。在这种情况下,你可以使用匿名函数来定义一个匿名函数作为preg_replace_callback()调用时的回调。 这样做你可以保留所有 调用信息在同一个位置并且不会因为一个不在任何其他地方使用的回调函数名称而污染函数名称空间。
subject:
要搜索替换的目标字符串或字符串数组。
limit:
对于每个模式用于每个 subject 字符串的最大可替换次数。 默认是-1(无限制)。
count:
如果指定,这个变量将被填充为替换执行的次数。
示例:
preg_replace_callback() 和 create_function():
<?php
// 将文本中的年份增加一年.
$text = "April fools day is 04/01/2002\n";
$text.= "Last christmas was 12/24/2001\n";
// 回调函数
function next_year($matches)
{
  // 通常: $matches[0]是完成的匹配
  // $matches[1]是第一个捕获子组的匹配
  // 以此类推
  return $matches[1].($matches[2]+1);
}
/**
 *将会输出:
 *April fools day is 04/01/2003
 *Last christmas was 12/24/2002
 */
echo preg_replace_callback(
            "|(\d{2}/\d{2}/)(\d{4})|",
            "next_year",
            $text);
//使用create_function
echo preg_replace_callback(
            "|(\d{2}/\d{2}/)(\d{4})|",
            create_function(
            '$matches',
            'return $matches[1].($matches[2]+1);'
            ),
            $text);
?>
PHP 相关文章推荐
php各种编码集详解和以及在什么情况下进行使用
Sep 11 PHP
php实现图片文件与下载文件防盗链的方法
Nov 03 PHP
php实现parent调用父类的构造方法与被覆写的方法
Feb 11 PHP
php对文件进行hash运算的方法
Apr 03 PHP
windows下安装php的memcache模块的方法
Apr 07 PHP
php7安装yar扩展的方法详解
Aug 03 PHP
PHP进阶学习之依赖注入与Ioc容器详解
Jun 19 PHP
Yii框架的redis命令使用方法简单示例
Oct 15 PHP
PHP字符串与数组处理函数用法小结
Jan 07 PHP
Yii2框架中一些折磨人的坑
Dec 15 PHP
php经典趣味算法实例代码
Jan 21 PHP
PHP 8新特性简介
Aug 18 PHP
php启用zlib压缩文件的配置方法
Jun 12 #PHP
Window下PHP三种运行方式图文详解
Jun 11 #PHP
控制PHP的输出:缓存并压缩动态页面
Jun 11 #PHP
基于PHP导出Excel的小经验 完美解决乱码问题
Jun 10 #PHP
win7+apache+php+mysql环境配置操作详解
Jun 10 #PHP
浅谈php中mysql与mysqli的区别分析
Jun 10 #PHP
探讨php中防止SQL注入最好的方法是什么
Jun 10 #PHP
You might like
PHP 编程请选择正确的文本编辑软件
2006/12/21 PHP
php实现查看邮件是否已被阅读的方法
2013/12/03 PHP
php正则修正符用法实例详解
2016/12/29 PHP
解决laravel5.4下的group by报错的问题
2019/10/16 PHP
Highslide.js是一款基于js实现的网页中图片展示插件
2020/03/30 Javascript
js option删除代码集合
2008/11/12 Javascript
JQuery从头学起第三讲
2010/07/06 Javascript
你需要知道的10个最佳javascript开发实践小结
2012/04/15 Javascript
ajax与302响应代码测试
2013/10/23 Javascript
js键盘上下左右键怎么触发function(实例讲解)
2013/12/14 Javascript
jQuery对下拉框,单选框,多选框的操作
2014/02/21 Javascript
jQuery form插件之formDdata参数校验表单及验证后提交
2016/01/23 Javascript
javascript禁止超链接跳转的方法
2016/02/02 Javascript
JavaScript实战之菜单特效
2016/08/16 Javascript
vue中动态添加class类名的方法
2018/09/05 Javascript
详解node和ES6的模块导出与导入
2020/02/19 Javascript
vue 解决data中定义图片相对路径页面不显示的问题
2020/08/13 Javascript
解决vue数据不实时更新的问题(数据更改了,但数据不实时更新)
2020/10/27 Javascript
使用python的pexpect模块,实现远程免密登录的示例
2019/02/14 Python
Python 串口读写的实现方法
2019/06/12 Python
Python使用__new__()方法为对象分配内存及返回对象的引用示例
2019/09/20 Python
python实现一个点绕另一个点旋转后的坐标
2019/12/04 Python
解决更改AUTH_USER_MODEL后出现的问题
2020/05/14 Python
django 模版关闭转义方式
2020/05/14 Python
Selenium自动化测试工具使用方法汇总
2020/06/12 Python
HTML5 拖放(Drag 和 Drop)详解与实例代码
2017/09/14 HTML / CSS
求职者应聘的自我评价
2013/10/16 职场文书
应届生会计求职信
2013/11/11 职场文书
春节晚会主持词
2014/03/24 职场文书
党校个人自我鉴定范文
2014/03/28 职场文书
班主任与学生安全责任书
2014/07/25 职场文书
党支部创先争优承诺书
2014/08/30 职场文书
农行心得体会
2014/09/02 职场文书
2015年党日活动总结范文
2015/03/25 职场文书
离婚纠纷代理词
2015/05/23 职场文书
2019行政前台转正申请书范文3篇
2019/08/15 职场文书