记录一次排查PHP脚本执行卡住的问题


Posted in PHP onDecember 27, 2016

发现问题

最近忽然从监控中发现,我们一个服务的一台机器负载比同机房的其他机器要高,而流入流出流量没有差别,进一步查看发现每个机房都有一台机器存在相同的现象,梳理后发现有问题的这些机器相比正常的机器多跑了一些PHP脚本,于是猜测是执行脚本出问题导致。

解决问题

登录机器后执行top命令,果然发现存在一个CPU占用较高的PHP进程,然后执行下列命令,发现存在一个由crontab启动的执行了很长时间的PHP脚本:

ps aux | grep 'php' | grep -v 'php-fpm'

由于之前也遇到过PHP脚本执行卡住的类似情况,当时的怀疑是跨机房的Mysql查询在网络抖动时导致Mysql连接卡住了,于是理所当然的将所有卡住的进程都kill掉了,再从负载上看机器马上就恢复正常了,于是心满意足的跑去干别的了。

过了一段时间,刷了下监控,发现问题又出现了,注释掉crontab并kill掉进程后,手动执行问题脚本,竟然能稳定复现问题!看来是把问题想得太简单了,尝试用strace命令看下卡住的进程当前究竟在干什么:

[tabalt@localhost ~] sudo strace -p 13793
Process 13793 attached - interrupt to quit

什么输出都没有!再用netstat看下这个进程是否打开了什么端口:

[tabalt@localhost ~] sudo netstat -tunpa | grep 13793
tcp  0  0 192.168.1.100:38019  192.168.1.101:3306  ESTABLISHED 13793/php
tcp  0  0 192.168.1.100:47107  192.168.1.102:6379  CLOSE_WAIT 13793/php

可以看到进程打开了两个端口,分别与Mysql和Redis建立了连接,并且处于连接建立(ESTABLISHED)和对方主动关闭连接(CLOSE_WAIT)的状态;初看确实像是和数据库的连接卡住了,但是因为吃过亏上过当,咱们使用tcpdump抓包看进程和数据库之间的交互:

tcpdump -i eth0 host 192.168.1.101 and port 3306 -w ~/mysql.cap

抓了好一会,~/mysql.cap 文件中却也没有任何输出,难道进程和Mysql之间已经没有任何交互了?那为什么连接建立没有关闭呢?看来只能从头追踪一下脚本的执行情况了:

首先为了能来得及strace到进程,在PHP脚本最开始的时候输出进程的pid并sleep 10s:

echo getmypid(); sleep(10);

然后启动tcpdump准备抓包本机和Mysql的交互过程。

最后执行PHP脚本,并复制输出的pid后在新窗口中执行strace命令。

这下strace和tcpdump都有内容了!从strace结果看recvfrom之后不再有poll,但并没有看出来有什么不对:

//...
poll([{fd=4, events=POLLIN|POLLERR|POLLHUP}], 1, 1471228928) = 1 ([{fd=4, revents=POLLIN}])
recvfrom(4, "://xxx.com/\0\0\23jiadia"..., 271, MSG_DONTWAIT, NULL, NULL) = 271
poll([{fd=4, events=POLLIN|POLLERR|POLLHUP}], 1, 1471228928) = 1 ([{fd=4, revents=POLLIN}])
recvfrom(4, "_b?ie=UTF8&node=658390051\0\0008www."..., 271, MSG_DONTWAIT, NULL, NULL) = 206

再从抓包结果看,执行了两条SQL查询语句之后,进程没有再次发送查询请求的包,从程序记录SQL语句日志中,也发现确实只执行了两条:

select * from sites where type = 1 limit 50;
select * from sites where type = 2 limit 50;

但从这些现象中,仍然没有能看出任何端倪,只好祭出终极大法:输出调试!大概看了下代码,并在关键地方添加输出语句,于是代码看起来如下:

echo("start foreach\n");
foreach($types as $type)
{
 echo("foreach $type\n");
 $result[$type] = $this->getSites($type);
}
echo("end foreach\n");

执行后输出如下,查询type为2的网址时卡住了:

start foreach
foreach 1
foreach 2

开始怀疑调用的getSites()方法有问题,代码如下:

$sites = array(); // 省略从数据库查询的代码
$siteNum = 8;  // 省略从配置读的代码
$urlKeys = $result = array();
for($i = 0; $i < $siteNum; $i++)
{
 do {
  $site = array_shift($sites);
  $urlKey = md5($site['url']);
 } while(array_key_exists($urlKey, $urlKeys));

 $urlKeys[$urlKey] = 1;
 $result[] = $site;
}
return $result;

原来这里为了实现拿8个不重复的网址写了2个循环,如果结果中不重复的网址只有7个就会有一个空,少于7个就会有死循环!于是查了下type为2的网址个数,果然是只有6个!

总结

该问题从发现到解决花了大概1天时间,虽然最后证明是低级的代码BUG导致,但是整个排查过程还是挺有收获的,最开始的想当然证明是非常肤浅的,过程中tcpdump和strace的结果也已经很能说明问题了,对各个工具的应用应该要更加熟练,工具的结果也要深入分析。以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。

PHP 相关文章推荐
PHP中其实也可以用方法链
Nov 10 PHP
关于尾递归的使用详解
May 02 PHP
解析MySql与Java的时间类型
Jun 22 PHP
kohana框架上传文件验证规则写法示例
Jul 14 PHP
利用PHP将部分内容用星号替换
Apr 21 PHP
在WordPress中使用wp_count_posts函数来统计文章数量
Jan 05 PHP
php HTML无刷新提交表单
Apr 05 PHP
PHP读取CSV大文件导入数据库的实例
Jul 24 PHP
PHP简单实现记录网站访问量功能示例
Jun 06 PHP
PHP静态方法和静态属性及常量属性的区别与介绍
Mar 22 PHP
PHP常用函数之获取汉字首字母功能示例
Oct 21 PHP
PHP连接SQL server数据库测试脚本运行实例
Aug 24 PHP
PHP串行化与反串行化实例分析
Dec 27 #PHP
PHP 表单提交及处理表单数据详解及实例
Dec 27 #PHP
iOS+PHP注册登录系统 PHP部分(上)
Dec 26 #PHP
PHP实现表单提交时去除斜杠的方法
Dec 26 #PHP
PHP简单实现冒泡排序的方法
Dec 26 #PHP
php mysql操作mysql_connect连接数据库实例详解
Dec 26 #PHP
PHP常用函数总结(180多个)
Dec 25 #PHP
You might like
一个简单的自动发送邮件系统(二)
2006/10/09 PHP
实用函数7
2007/11/08 PHP
腾讯QQ php程序员面试题目整理
2010/06/08 PHP
使用PHPCMS搭建wap手机网站
2015/09/20 PHP
php版微信自定义回复功能示例
2016/12/05 PHP
PHP使用imagick扩展实现合并图像的方法
2017/04/25 PHP
laravel框架模板之公共模板、继承、包含实现方法分析
2019/08/30 PHP
js 利用image对象实现图片的预加载提高访问速度
2013/03/29 Javascript
使用CSS和jQuery模拟select并附提交后取得数据的代码
2013/10/18 Javascript
用js代码改变单选框选中状态的简单实例
2013/12/18 Javascript
js数值计算时使用parseInt进行数据类型转换(jquery)
2014/10/07 Javascript
javascript 构造函数方式定义对象
2015/01/02 Javascript
JavaScript 事件绑定及深入
2015/04/13 Javascript
js判断子窗体是否关闭的方法
2015/08/11 Javascript
jQuery实现带玻璃流光质感的手风琴特效
2015/11/20 Javascript
jquery replace方法去空格
2017/05/08 jQuery
jQuery实现table中两列CheckBox只能选中一个的示例
2017/09/22 jQuery
jquery使用echarts实现有向图可视化功能示例
2019/11/25 jQuery
[38:54]完美世界DOTA2联赛PWL S2 Rebirth vs LBZS 第一场 11.28
2020/12/01 DOTA
python中类的一些方法分析
2014/09/25 Python
Python中的对象,方法,类,实例,函数用法分析
2015/01/15 Python
利用python获取某年中每个月的第一天和最后一天
2016/12/15 Python
PyChar学习教程之自定义文件与代码模板详解
2017/07/17 Python
Python3利用SMTP协议发送E-mail电子邮件的方法
2017/09/30 Python
对python中array.sum(axis=?)的用法介绍
2018/06/28 Python
Python 做曲线拟合和求积分的方法
2018/12/29 Python
python+selenium爬取微博热搜存入Mysql的实现方法
2021/01/27 Python
Pytorch - TORCH.NN.INIT 参数初始化的操作
2021/02/27 Python
英国著名的美容护肤和护发产品购物网站:Lookfantastic
2020/11/23 全球购物
研究生毕业自我鉴定范文
2014/03/27 职场文书
法制报告会主持词
2014/04/02 职场文书
工作说明书格式
2014/07/29 职场文书
2014年党委工作总结
2014/11/22 职场文书
网络研修随笔感言
2015/11/18 职场文书
Java实现简易的分词器功能
2021/06/15 Java/Android
MySQL 数据类型详情
2021/11/11 MySQL