遭遇php的in_array低性能问题


Posted in PHP onSeptember 17, 2013

PHP的性能一直在提高。然而,若是用的不恰当,或是一个不留神,还是可能会踩到PHP内部实现方面的坑的。我在前几天的一个性能问题上就碰到了。

事情是这样子的,一位同事反馈我们的一个接口每次返回需要5秒之久,我们一起review了代码,“惊喜”的发现居然在循环(大约900次)中调用了一个读缓存的操作,而这个缓存的key并没有改变,因此我们把这段代码移到了循环外面,再测,接口返回时间降到了2秒,呜呼!虽然提升了1倍,但明显不是我们能接受的结果!
出现性能问题的代码量并不大,我们排除了IO问题以后,写了一段测试代码,果然问题很快重现。

<?php 
$y="1800"; 
$x = array(); 
for($j=0;$j<2000;$j++){ 
$x[]= "{$j}"; 
} for($i=0;$i<3000;$i++){ 
if(in_array($y,$x)){ 
continue; 
} 
} 
?>

shell$ time /usr/local/php/bin/php test.php

real 0m1.132s
user 0m1.118s
sys 0m0.015s

对的,我们用的就是字符串型的数字,从缓存拿出来就是这样子的啦!所以这里是特意转成字符串的(如果直接是数字,并不会出现这个问题 ,各位可以自行验证)。可以看出时间耗掉了1秒,才3000次循环,后面的sys用时也注定我们用strace不会拿到什么有效信息。

shell$ strace -ttt -o xxx /usr/local/php/bin/php test.php
shell$ less xxx

遭遇php的in_array低性能问题

我们只看到这两次系统调用之间的延时非常大,却并不知道干了什么?一筹莫展了,幸好,Linux下的调试利器除了strace还有ltrace(当然还有dtrace,ptrace,不在本文讨论范围了,略去)。

引用:strace用来 跟踪一个进程的系统调用或信号产生的情况,而 ltrace用来 跟踪进程调用库函数的情况(via IBM developerworks)。

为了排除干扰因素,我们将$x直接赋值为array(“0″,”1″,”2″,……)的形式,避免过多的malloc调用影响结果。执行

shell$ ltrace -c /usr/local/php/bin/php test.php

如图2

遭遇php的in_array低性能问题

我们看到库函数__strtol_internal的调用非常之频繁,达到了94%,太夸张了,然后我又查了一下这个库函数__strtol_internal是干嘛的,原来是strtol的别名,简单的说就是把字符串转换成长整形,可以猜测PHP引擎已经检测到这是一个字符串型的数字,所以期望将他们转换成长整型来比较,这个转换过程中消耗了太多时间,我们再次执行:

shell$ ltrace -e "__strtol_internal" /usr/local/php/bin/php test.php

可以轻松抓到大量下图这样的调用,到此,问题找到了,in_array这种松比较,会将两个字符型数字串先转换为长整型再进行比较,却不知性能就耗在这上面了。

遭遇php的in_array低性能问题

知道了症结所在,我们解决的办法就很多了,最简单的就是为in_array加第三个参数为true,即变为严格比较,同时还要比较类型,这样避免了PHP自作聪明的转换类型,跑起来果然快多了,代码如下:

<?php
$y="1800";
$x = array();
for($j=0;$j<2000;$j++){
        $x[]= "{$j}";
}
for($i=0;$i<3000;$i++){
        if(in_array($y,$x,true)){
                continue;
        }
}
?>
shell$ time /usr/local/php/bin/php test.php real 0m0.267s 
user 0m0.247s 
sys 0m0.020s

快了好多倍啊!!!可以看到sys耗时几乎没有太大变化。我们再次ltrace一把,还是要把$x直接赋值,排除malloc调用的干扰,因为我们实际应用中是从缓存里一次拉出来的,所以也不存在示例代码中这样的循环来申请内存的情况。
再次执行

shell$ ltrace -c /usr/local/php/bin/php test.php

如下图:

遭遇php的in_array低性能问题

__ctype_tolower_loc占用了最多的时间!查了一下库函数__ctype_tolower_loc是干嘛的:简单的理解是将字符串转换成小写,那么这说明in_array比较字符串不区分大小写吗?其实这个函数调用已经和我们这个in_array感觉联系不大了,关于in_array的实现,还是去看看PHP的源码,大概理解的更为透彻了,好了,没法往下说了,欢迎与我交流,写的不对的地方请多多斧正。

———————2013.08.29分割线——————————

晚上又翻了以下PHP 5.4.10的源码,对in_array的兴趣真大啊,哈哈,位于./ext/standard/array.c的第1248行,可以看到他调用了php_search_array函数,下面的array_serach也是调的这个,只是最后一个参数不同!经过一番跟踪,在in_array松比较的情况下,他最终调用的函数 zendi_smart_strcmp(果然是个“聪明”函数)进行比较,位于./Zend/zend_operators.c,我们用ltrace抓到的大量转换成整型的操作就是那个is_numeric_string_ex的行为。

遭遇php的in_array低性能问题

函数is_numeric_string_ex是在./Zend/zend_operators.h中定义的,在前面进行了一堆的判断和转换之后,在232行调用了strtol,就是我们在文章中提到的系统函数了,将字符串转换成长整型,有图有真相

遭遇php的in_array低性能问题

PHP 相关文章推荐
php 方便水印和缩略图的图形类
May 21 PHP
php 无极分类(递归)实现代码
Jan 05 PHP
destoon在360浏览器下出现用户被强行注销的解决方法
Jun 26 PHP
PHP不用递归遍历目录下所有文件的代码
Jul 04 PHP
PHP下通过QRCode类库创建中间带网站LOGO的二维码
Jul 12 PHP
Yii中srbac权限扩展模块工作原理与用法分析
Jul 14 PHP
PHP类和对象相关系统函数与运算符小结
Sep 28 PHP
php类的自动加载操作实例详解
Sep 28 PHP
php使用PDO从数据库表中读取数据的实现方法(必看)
Jun 02 PHP
thinkPHP5框架闭包函数与子查询传参用法示例
Aug 02 PHP
浅谈laravel aliases别名的原理
Oct 24 PHP
php 函数中静态变量使用的问题实例分析
Mar 05 PHP
PHP和JavaScrip分别获取关联数组的键值示例代码
Sep 16 #PHP
PHP中的str_repeat函数在JavaScript中的实现
Sep 16 #PHP
改写函数实现PHP二维/三维数组转字符串
Sep 13 #PHP
php jq jquery getJSON跨域提交数据完整版
Sep 13 #PHP
PHP Session 变量的使用方法详解与实例代码
Sep 11 #PHP
php中通过数组进行高效随机抽取指定条记录的算法
Sep 09 #PHP
php文件夹与文件目录操作函数介绍
Sep 09 #PHP
You might like
Http 1.1 Etag 与 Last-Modified提高php效率
2008/01/10 PHP
PHP用星号隐藏部份用户名、身份证、IP、手机号等实例
2014/04/08 PHP
PHP实现删除多重数组对象属性并重新赋值的方法
2017/06/07 PHP
基于JQuery实现CheckBox全选全不选
2011/06/27 Javascript
jquery获取元素索引值index()示例
2014/02/13 Javascript
ion content 滚动到底部会遮住一部分视图的快速解决方法
2016/09/06 Javascript
DOM 事件的深入浅出(二)
2016/12/05 Javascript
jquery 仿锚点跳转到页面指定位置的实例
2017/02/14 Javascript
Node.js调试技术总结分享
2017/03/12 Javascript
基于JavaScript实现报警器提示音效果
2017/10/27 Javascript
微信小程序实现分享到朋友圈功能
2018/07/19 Javascript
微信小程序使用二次贝塞尔曲线画波浪
2018/12/25 Javascript
详解Vue3.0 前的 TypeScript 最佳入门实践
2019/06/18 Javascript
layui写后台表格思路和赋值用法详解
2019/11/14 Javascript
[36:20]KG vs SECRET 2019国际邀请赛小组赛 BO2 第二场 8.16
2019/08/19 DOTA
python+opencv实现动态物体识别
2018/01/09 Python
numpy中的高维数组转置实例
2018/04/17 Python
PyTorch和Keras计算模型参数的例子
2020/01/02 Python
python与mysql数据库交互的实现
2020/01/06 Python
matlab中imadjust函数的作用及应用举例
2020/02/27 Python
基于Python共轭梯度法与最速下降法之间的对比
2020/04/02 Python
如何利用python 读取配置文件
2021/01/06 Python
IE9下html5初试小刀
2010/09/21 HTML / CSS
SmartBuyGlasses意大利:购买太阳镜、眼镜和隐形眼镜
2018/11/20 全球购物
我想声明一个指针并为它分配一些空间, 但却不行。这些代码有什么 问题?char *p; *p = malloc(10);
2016/10/06 面试题
酒店前厅员工辞职信
2014/01/08 职场文书
党员对照检查材料
2014/09/22 职场文书
关于随地扔垃圾的检讨书
2014/09/30 职场文书
教师群众路线心得体会
2014/11/04 职场文书
小学生光盘行动倡议书
2015/04/28 职场文书
长江七号观后感
2015/06/11 职场文书
旅游投诉信范文
2015/07/02 职场文书
Python+Appium新手教程
2021/04/17 Python
Golang 实现超大文件读取的两种方法
2021/04/27 Golang
如何利用Matlab制作一款真正的拼图小游戏
2021/05/11 Python
vue实现input输入模糊查询的三种方式
2022/08/14 Vue.js