6.3 PCRE兼容正则表达式函数
PHP中提供了两套支持正则表达式的函数库,但是由于PCRE函数库在执行效率上要略优于POSIX函数库,所以这里只讲解PCRE函数库中的函数。实现PCRE风格的正则表达式的函数有7个,下面就来了解一下这7个PCRE函数。
6.3.1 preg_grep()函数
函数语法:
array preg_grep ( string pattern, array input )
函数功能:使用数组input中的元素一一匹配表达式pattern,最后返回由所有相匹配的元素所组成的数组。
【例6.1】在数组$arr中匹配具有正确格式的电话号(010-1234****等),并保存到另一个数组中。实例代码如下:(实例位置:资源包\TM\sl\6\1)
<?php $preg = '/\d{3,4}-?\d{7,8}/'; //国内电话格式表达式 $arr = array('043212345678','0431-7654321','12345678'); //包含元素的数组 $preg_arr = preg_grep($preg,$arr); //使用preg_grep()查找匹配元素 var_dump($preg_arr); //查看新数组结构 ?>
运行结果如图6.1所示。
图6.1 使用preg_grep()函数
6.3.2 preg_match()和preg_match_all()函数
函数语法:
int preg_match/preg_match_all ( string pattern, string subject [, array matches] )
函数功能:在字符串subject中匹配表达式pattern。函数返回匹配的次数。如果有数组matches,那么每次匹配的结果都将被存储到数组matches中。
函数preg_match()的返回值是0或1。因为该函数在匹配成功后就停止继续查找了。而preg_match_all()函数则会一直匹配到最后才会停止。参数array matches对于preg_match_all()函数是必须有的,而对前者则可以省略。
【例6.2】使用preg_match()函数和preg_match_all()函数来匹配字串$str,并返回各自的匹配次数。实例代码如下:(实例位置:资源包\TM\sl\6\2)
<?php $str = 'This is an example!'; $preg = '/\b\w{2}\b/'; $num1 = preg_match($preg,$str,$str1); echo $num1.'<br>'; var_dump($str1); $num2 = preg_match_all($preg,$str,$str2); echo '<p>'.$num2.'<br>'; var_dump($str2); ?>
运行结果如图6.2所示。
图6.2 preg_match()函数和preg_match_all()函数
6.3.3 preg_quote()函数
函数语法:
string preg_quote ( string str [, string delimiter] )
函数功能:该函数将字符串str中的所有特殊字符进行自动转义。如果有参数delimiter,那么该参数所包含的字串也将被转义。函数返回转义后的字串。
【例6.3】输出常用的特殊字符,并且将字母b也当作特殊字符输出。实例代码如下:(实例位置:资源包\TM\sl\6\3)
<?php $str = '!、$、^、*、+、.、[、]、\\、/、b、<、>'; $str2 = 'b'; $match_one = preg_quote($str,$str2); echo $match_one; ?>
结果为:\!、\$、\^、\*、\+、\.、\[、\]、\\、/、\b、\<、\>
注意
这里的特殊字符是指正则表达式中具有一定意义的元字符,其他如“@”“#”等则不会被当作特殊字符处理。
6.3.4 preg_replace()函数
函数语法:
mixed preg_replace ( mixed pattern, mixed replacement, mixed subject [, int limit] )
函数功能:该函数在字符串subject中匹配表达式pattern,并将匹配项替换成字串replacement。如果有参数limit,则替换limit次。
说明
如果参数中调用的是数组,有可能在调用过程中并不是按照数组的key值进行替换,所以在调用之前需要使用ksort()函数对数组重新排列。
【例6.4】本例实现一个常见的UBB代码转换功能,将输入的“[b]…[/b]”“[i]…[/i]”等类似的格式转换为HTML能识别的标签。实例代码如下:(实例位置:资源包\TM\sl\6\4)
<?php $string = '[b]粗体字[/b]'; $b_rst = preg_replace('/\[b\](.*)\[\/b\]/i','<b>$1</b>',$string); echo $b_rst; ?>
结果为:粗体字
说明
preg_replace()函数中的字串“$1”是在正则表达式外调用分组,按照$1、$2排列,依次表示从左到右的分组顺序,也就是括号顺序。$0表示的是整个正则表达式的匹配值。关于反向引用的其他用法,请参考6.2.12节。
6.3.5 preg_replace_callback()函数
函数语法:
mixed preg_replace_callback ( mixed pattern, callback callback, mixed subject [, int limit] )
preg_replace_callback()函数与preg_replace()函数的功能相同,都用于查找和替换字串。不同的是,preg_replace_callback()函数使用一个回调函数(callback)来代替replacement参数。
注意
在preg_replace_callback()函数的回调函数中,字符串使用“''”,这样可以保证字符串中的特殊符号不被转义。
【例6.5】本例使用回调函数来实现UBB功能。实例代码如下:(实例位置:资源包\TM\sl\6\5)
<?php function c_back($str){ $str = "<font color=$str[1]>$str[2]</font>"; return $str; } $string = '[color=blue]字体颜色[/color]'; echo preg_replace_callback('/\[color=(.*)\](.*)\[\/color\]/U',"c_back",$string); ?>
结果为:字体颜色
注意
本例运行结果“字体颜色”为蓝色字体,书中看不出效果,请运行本书资源包附带的实例。
6.3.6 preg_split()函数
函数语法:
array preg_split ( string pattern, string subject [, int limit ] )
函数功能:使用表达式pattern来分割字符串subject。如果有参数limit,那么数组最多有limit个元素。该函数与ereg_split()函数的使用方法相同,这里不再举例。