php+redis在实际项目中HTTP 500: Internal Server Error故障排除


Posted in PHP onFebruary 05, 2017

问题描述
用户量快速增长,访问量在短时间内翻倍,由于前期容量规划做得比较好,硬件资源可以支撑,可是软件系统方面出现了大问题:
40% 的请求都会返回 HTTP 500: Internal Server Error
通过查看日志,发现错误是在 PHP <-> Redis 的连接处理上
调试处理

第1次
刚开始时并没有找到根本原因,只能尝试各种与错误相关的办法,例如:
增加 PHP 连接数,并把超时时间从 500ms 增加到 2.5s
禁止掉 PHP 设置中的 default_socket_timeout
在主机系统中禁止掉 SYN cookies
检查 Redis 和 Webservers 的文件描述符数量
增加主机系统的 mbuffer
调整 TCP backlog 数量
……

尝试了很多方法,但全部无效

第2次
想在预发布环境中重现这个问题,可惜,还是没成功,应为流量不够大,无法复现

第3次
会不会是代码中没有关闭 Redis 连接呢?
正常来讲,PHP在执行结束时会自动关闭资源连接,但老版本中会有内存泄漏的问题,保险起见,把代码都修改一遍,手动关闭连接
结果还是无效

第4次
怀疑目标:phpredis 这个客户端库
做 A/B 测试,替换回 predis 这个库,部署到数据中心中 20% 的用户量上
得益于良好的代码结构,替换工作很快完成
可结果依旧是无效,但也有好的一面,可以证明 phpredis 没问题嘛

第5次
查看了一下 Redis 的版本,是 v2.6,当时最新版本是 v2.8.9
升级 Redis 试一下吧,升完后还是不行
没事儿,要保持乐观,这不顺便把 Redis 版本升为最新的了

第6次
通过查找大量文档,在官方文档中发现了一个调试好方法 Redis Software Watchdog,打开后执行:

$ redis-cli --latency -p 6380 -h 1.2.3.4
min: 0, max: 463, avg: 2.03 (19443 samples)

查看 Redis 日志:

...
[20398] 22 May 09:20:55.351 * 10000 changes in 60 seconds. Saving...
[20398] 22 May 09:20:55.759 * Background saving started by pid 41941
[41941] 22 May 09:22:48.197 * DB saved on disk
[20398] 22 May 09:22:49.321 * Background saving terminated with success
[20398] 22 May 09:25:23.299 * 10000 changes in 60 seconds. Saving...
[20398] 22 May 09:25:23.644 * Background saving started by pid 42027
...

发现了问题:
每隔几分钟就向硬盘保存一次数据,fork 一个后台存储进行为什么需要大概 400ms(通过上面日志的第1条和第2条的时间可以看出来)

到这儿,终于找到问题的根源了,因为 Redis 实例中有大量的数据,导致每次持久化操作 fork 后台进程时非常耗时,并且在他们的业务中经常修改key,又导致了频繁触发持久化,也就经常产生对 Redis 的阻塞

处理办法:使用单独的 slave 来做持久化

这个 slave 不处理真实的流量请求,唯一的作用就是处理持久化,把之前 Redis 实例上的持久化操作转移到这个 slave 上

效果非常明显,问题基本解决,但有的时候还是会报错

第7次
排查可能阻塞 Redis 的慢查询,发现有地方使用了 keys *

因为 Redis 中的数据越来越多,这个命令自然会产生严重阻塞

可以使用 scan 进行替换

第8次
经过前面的调整,问题已经解决,随后的几个月,即使流量在不断增长,也都抗住了

但他们意识到了新的问题:

现在的方式是,来一个请求就创建一个 Redis 连接,执行几个命令,然后再断开连接,在请求量很大时,这个方式产生了严重的性能浪费,一半以上的命令是用来处理连接操作的,这都超过了业务逻辑上的处理,也使 Redis 变慢

解决方法:引入 proxy,他们选择了 twitter 的 twemproxy,只需要在每个 webserver 上安装代理,twemproxy负责与 Redis 实例进行持久连接,这样就大大减少了连接方面的操作

twemproxy还有两个方便的地方:

支持 memcached
可以阻止非常耗时或者危险的命令,例如 keys、flushall
效果自然很完美,再也不用担心之前的连接错误

第9次
通过数据分片来继续优化:

对不同上下文的数据拆分隔离
对相同上下文的数据进行一致性哈希分片
效果:

减少了每台机器上的请求、负载
提升了缓存的可靠性,不担心节点故障

小结
原文作者写的非常好,详细的描述了他们在 Redis 应用上的成长历程,是很值得参考的实践经验
原文地址http://tech.trivago.com/2017/01/25/learn-redis-the-hard-way-in-production

PHP 相关文章推荐
php中支持多种编码的中文字符串截取函数!
Mar 20 PHP
php强制下载类型的实现代码
Apr 21 PHP
php网站判断用户是否是手机访问的方法
Nov 01 PHP
thinkphp常见路径用法分析
Dec 02 PHP
PHP中的类型约束介绍
May 11 PHP
jQuery向下滚动即时加载内容实现的瀑布流效果
Jan 07 PHP
Yii2如何批量添加数据
May 17 PHP
php  PATH_SEPARATOR判断当前服务器系统类型实例
Oct 28 PHP
php base64 编码与解码实例代码
Mar 21 PHP
PHP使用星号替代用户名手机和邮箱的实现代码
Feb 07 PHP
PHP实现将base64编码字符串转换成图片示例
Jun 22 PHP
php文件上传原理与实现方法详解
Dec 20 PHP
php实现给二维数组中所有一维数组添加值的方法
Feb 04 #PHP
PHP进制转换实例分析(2,8,16,36,64进制至10进制相互转换)
Feb 04 #PHP
php加密之discuz内容经典加密方式实例详解
Feb 04 #PHP
yii2实现 &quot;上一篇,下一篇&quot; 功能的代码实例
Feb 04 #PHP
PHP正则表达式匹配替换与分割功能实例浅析
Feb 04 #PHP
/etc/php-fpm.d/www.conf 配置注意事项
Feb 04 #PHP
PHP正则替换函数preg_replace()报错:Notice Use of undefined constant的解决方法分析
Feb 04 #PHP
You might like
php 获取客户端的真实ip
2009/11/30 PHP
解析PHP跨站刷票的实现代码
2013/06/18 PHP
实用的简单PHP分页集合包括使用方法
2013/10/21 PHP
ThinkPHP标签制作教程
2014/07/10 PHP
PHP错误Allowed memory size of 67108864 bytes exhausted的3种解决办法
2014/07/28 PHP
基于PHP实现等比压缩图片大小
2016/03/04 PHP
PHP实现二叉树深度优先遍历(前序、中序、后序)和广度优先遍历(层次)实例详解
2018/04/20 PHP
goto语法在PHP中的使用教程
2020/09/17 PHP
Docker 安装 PHP并与Nginx的部署实例讲解
2021/02/27 PHP
JSChart轻量级图形报表工具(内置函数中文参考)
2010/10/11 Javascript
突发奇想的一个jquery插件
2010/11/19 Javascript
浅谈javascript函数式编程
2015/09/06 Javascript
JavaScript数组去重的两种方法推荐
2016/04/05 Javascript
深入理解Angularjs中$http.post与$.post
2017/05/19 Javascript
package.json文件配置详解
2017/06/15 Javascript
详解如何优雅地在React项目中使用Redux
2017/12/28 Javascript
vue-cli项目优化方法- 缩短首屏加载时间
2018/04/01 Javascript
JS与jQuery实现ListBox上移,下移,左移,右移操作功能示例
2018/05/31 jQuery
Vue在chrome44偶现点击子元素事件无法冒泡的解决方法
2019/12/15 Javascript
从零使用TypeScript开发项目打包发布到npm
2020/02/14 Javascript
python使用any判断一个对象是否为空的方法
2014/11/19 Python
python图像处理之镜像实现方法
2015/05/30 Python
Python的Django框架中使用SQLAlchemy操作数据库的教程
2016/06/02 Python
Python安装Numpy和matplotlib的方法(推荐)
2017/11/02 Python
python先序遍历二叉树问题
2017/11/10 Python
Python生成8位随机字符串的方法分析
2017/12/05 Python
分享Pycharm中一些不为人知的技巧
2018/04/03 Python
Python中Flask-RESTful编写API接口(小白入门)
2019/12/11 Python
CSS3 box-sizing属性
2009/04/17 HTML / CSS
详解移动端HTML5页面端去掉input输入框的白色背景和边框(兼容Android和ios)
2016/12/15 HTML / CSS
canvas简易绘图的实现(海绵宝宝篇)
2018/07/04 HTML / CSS
你经历的项目中的SCM配置项主要有哪些?什么是配置项?
2013/11/04 面试题
世界卫生日宣传活动总结
2015/02/09 职场文书
运动会加油稿50字
2015/07/21 职场文书
Python+OpenCV实现图片中的圆形检测
2022/04/07 Python
Win11显卡控制面板打开显卡设置方法
2022/04/20 数码科技