PHP-CGI进程CPU 100% 与 file_get_contents 函数的关系分析


Posted in PHP onAugust 15, 2011

后来,我通过跟踪发现,这类情况的出现,跟 PHP 的 file_get_contents() 函数有着密切的关系。

大、中型网站中,基于 HTTP 协议的 API 接口调用,是家常便饭。PHP 程序员们喜欢使用简单便捷的 file_get_contents("http://example.com/") 函数,来获取一个 URL 的返回内容,但是,如果 http://example.com/ 这个网站响应缓慢,file_get_contents() 就会一直卡在那儿,不会超时。

我们知道,在 php.ini 中,有一个参数 max_execution_time 可以设置 PHP 脚本的最大执行时间,但是,在 php-cgi(php-fpm) 中,该参数不会起效。真正能够控制 PHP 脚本最大执行时间的是 php-fpm.conf 配置文件中的以下参数: The timeout (in seconds) for serving a single request after which the worker process will be terminated
Should be used when 'max_execution_time' ini option does not stop script execution for some reason
'0s' means 'off'
<value name="request_terminate_timeout">0s</value>

默认值为 0 秒,也就是说,PHP 脚本会一直执行下去。这样,当所有的 php-cgi 进程都卡在 file_get_contents() 函数时,这台 Nginx+PHP 的 WebServer 已经无法再处理新的 PHP 请求了,Nginx 将给用户返回“502 Bad Gateway”。修改该参数,设置一个 PHP 脚本最大执行时间是必要的,但是,治标不治本。例如改成 30s,如果发生 file_get_contents() 获取网页内容较慢的情况,这就意味着 150 个 php-cgi 进程,每秒钟只能处理 5 个请求,WebServer 同样很难避免“502 Bad Gateway”。

要做到彻底解决,只能让 PHP 程序员们改掉直接使用 file_get_contents("http://example.com/") 的习惯,而是稍微修改一下,加个超时时间,用以下方式来实现 HTTP GET 请求。要是觉得麻烦,可以自行将以下代码封装成一个函数。

<?php 
$ctx = stream_context_create(array( 
'http' => array( 
'timeout' => 1 //设置一个超时时间,单位为秒 
) 
) 
); 
file_get_contents("http://example.com/", 0, $ctx); 
?>

当然,导致 php-cgi 进程 CPU 100% 的原因不只有这一种,那么,怎么确定是 file_get_contents() 函数导致的呢?

首先,使用 top 命令查看 CPU 使用率较高的 php-cgi 进程。

top - 10:34:18 up 724 days, 21:01, 3 users, load average: 17.86, 11.16, 7.69 
Tasks: 561 total, 15 running, 546 sleeping, 0 stopped, 0 zombie 
Cpu(s): 5.9%us, 4.2%sy, 0.0%ni, 89.4%id, 0.2%wa, 0.0%hi, 0.2%si, 0.0%st 
Mem: 8100996k total, 4320108k used, 3780888k free, 772572k buffers 
Swap: 8193108k total, 50776k used, 8142332k free, 412088k cached 
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 
10747 www 18 0 360m 22m 12m R 100.6 0.3 0:02.60 php-cgi 
10709 www 16 0 359m 28m 17m R 96.8 0.4 0:11.34 php-cgi 
10745 www 18 0 360m 24m 14m R 94.8 0.3 0:39.51 php-cgi 
10707 www 18 0 360m 25m 14m S 77.4 0.3 0:33.48 php-cgi 
10782 www 20 0 360m 26m 15m R 75.5 0.3 0:10.93 php-cgi 
10708 www 25 0 360m 22m 12m R 69.7 0.3 0:45.16 php-cgi 
10683 www 25 0 362m 28m 15m R 54.2 0.4 0:32.65 php-cgi 
10711 www 25 0 360m 25m 15m R 52.2 0.3 0:44.25 php-cgi 
10688 www 25 0 359m 25m 15m R 38.7 0.3 0:10.44 php-cgi 
10719 www 25 0 360m 26m 16m R 7.7 0.3 0:40.59 php-cgi

找其中一个 CPU 100% 的 php-cgi 进程的 PID,用以下命令跟踪一下:

strace -p 10747 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout) 
select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0}) 
poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)

那么,就可以确定是 file_get_contents() 导致的问题了。

PHP 相关文章推荐
教你IIS6的PHP最佳配置方法
Sep 05 PHP
用Flash图形化数据(二)
Oct 09 PHP
php&amp;java(三)
Oct 09 PHP
PHP setcookie() cannot modify header information 的解决方法
Jan 09 PHP
php模拟socket一次连接,多次发送数据的实现代码
Jul 26 PHP
linux下为php添加curl扩展的方法
Jul 29 PHP
PHP的基本常识小结
Jul 05 PHP
使用PHP similar text计算两个字符串相似度
Nov 06 PHP
CodeIgniter连贯操作的底层原理分析
May 17 PHP
PHP基本语法实例总结
Sep 09 PHP
php中错误处理操作实例分析
Aug 23 PHP
PHP实现抽奖功能实例代码
Jun 30 PHP
11个PHP 分页脚本推荐
Aug 15 #PHP
PHP版国家代码、缩写查询函数代码
Aug 14 #PHP
PHP动态创建Web站点的方法
Aug 14 #PHP
php程序的国际化实现方法(利用gettext)
Aug 14 #PHP
PHP排序之二维数组的按照字母排序实现代码
Aug 13 #PHP
php中使用Curl、socket、file_get_contents三种方法POST提交数据
Aug 12 #PHP
PHP简洁函数小结
Aug 12 #PHP
You might like
PHP学习笔记之一
2011/01/17 PHP
46 个非常有用的 PHP 代码片段
2016/02/16 PHP
phpStudy2016 配置多个域名期间遇到的问题小结
2017/10/19 PHP
thinkphp5 URL和路由的功能详解与实例
2017/12/26 PHP
PHP Cli 模式设置进程名称的方法
2019/06/12 PHP
javascript或asp实现的判断身份证号码是否正确两种验证方法
2009/11/26 Javascript
一个封装js代码-----展开收起效果示例
2013/07/03 Javascript
按Enter键触发事件的jquery方法实现代码
2014/02/17 Javascript
jQuery 写的简单打字游戏可以提示正确和错误的次数
2014/07/01 Javascript
点击表单提交时出现jQuery没有权限的解决方法
2014/07/23 Javascript
js onmousewheel事件多次触发问题解决方法
2014/10/17 Javascript
开源的javascript项目Kissy介绍
2014/11/28 Javascript
js实现向右横向滑出的二级菜单效果
2015/08/27 Javascript
jQuery网页右侧广告跟随滚动代码分享
2020/04/20 Javascript
浅析Bootstrap表格的使用
2016/06/23 Javascript
JavaScript数组去重的几种方法效率测试
2016/10/23 Javascript
详解在vue-cli项目中安装node-sass
2017/06/21 Javascript
webpack3+React 的配置全解
2017/08/21 Javascript
vue获取data数据改变前后的值方法
2019/11/07 Javascript
JavaScript简单编程实例学习
2020/02/14 Javascript
基于vue和bootstrap实现简单留言板功能
2020/05/30 Javascript
理解python多线程(python多线程简明教程)
2014/06/09 Python
Python中实现对Timestamp和Datetime及UTC时间之间的转换
2015/04/08 Python
Python实现矩阵相乘的三种方法小结
2018/07/26 Python
对python xlrd读取datetime类型数据的方法详解
2018/12/26 Python
深入学习python多线程与GIL
2019/08/26 Python
基于Python中random.sample()的替代方案
2020/05/23 Python
python实现mask矩阵示例(根据列表所给元素)
2020/07/30 Python
Python爬取12306车次信息代码详解
2020/08/12 Python
国际商务专业学生个人的自我评价
2013/09/28 职场文书
银行见习期自我鉴定
2014/01/29 职场文书
2014年人民警察入党思想汇报
2014/10/12 职场文书
班主任先进事迹材料
2014/12/17 职场文书
2015年征兵工作总结
2015/07/23 职场文书
详解Go语言运用广度优先搜索走迷宫
2021/06/23 Python
MySQL中IF()、IFNULL()、NULLIF()、ISNULL()函数的使用详解
2021/06/26 MySQL