提升node.js中使用redis的性能遇到的问题及解决方法


Posted in Javascript onOctober 30, 2018

问题初现

某基于node.js开发的业务系统向外提供了一个dubbo服务,提供向第三方缓存查询、设置多项业务数据并聚合操作结果。在QPS达到800时(两台虚拟机,每台机器4Core8G4node进程),在监控平台上出现了非常多的slow rt警告,平均接口响应达到60+ms,请求报警率达到80%+。

为找到造成该服务吞吐量过低的罪魁祸首,业务人员在请求日志中打点了所有查询缓存的操作,结果显示每个请求查询缓存耗时在50-100ms之间跳动。查询了redis-server的监控数据发现,不存在server端的慢查询,在整个监控区间内服务端处理时间在40us徘徊,因此排除了redis-server的处理能力不足原因;

通过登录内网机器进行不断测试到对应redis server机器的端到端时延发现内部局域网的带宽、时延与抖动足够正常,都不是造成该问题的原因。

因此,错误原因定位到了调用redis client的业务代码以及redis client的I/O性能。

本文中提到的node redis client采用的基于node-redis封装的二方包,因此问题排查也基于node-redis这个模块。

瓶颈在哪

为了在本地模拟线上环境的并发,可以做一个不是很严谨的测试:

async ()=>{
  let dd = Date.now()
  let arr = []
  for(let i=0;i<200;i++){
    arr.push(new Promise((res,rej)=>{
      let hrtime = process.hrtime();
      client.send_command('get',['key'], function(e,r) {
      let diff = process.hrtime(hrtime);
      let cost = (diff[0] * NS_PER_SEC + diff[1])/1000000;
      console.log(`final: ${cost} ms`)
      res();
      });
    }));
  }
  await Promise.all(arr)
  console.log('ops/sec:',200*1000/(Date.now() - dd),Date.now() - dd);
}

会发现每个请求的rt都会比前一个请求来的大

提升node.js中使用redis的性能遇到的问题及解决方法

 最后一个请求的rt竟然达到了257 ms!虽然在node单进程像示例代码那样并发执行200次get请求是非常少见而且愚蠢的(关于示例代码的优化在在下节讲述),但是针对这个示例必须找到请求delay增加的原因。

 为此继续分析,redis client采用的是单连接模式,底层采用的非阻塞网络I/O,socket.recv()在node层面是通过监听socket的data事件完成的,因此先分析redis-client读性能如何:

提升node.js中使用redis的性能遇到的问题及解决方法

上图每段日志的含义分别表示:

- data events trigger times: socket data事件触发的次数
- data event start from prevent event: data事件距离上次触发的时间间隔
- data events exec time(ms): 本次事件处理函数执行时间

 上图只是截取了最初的请求日志,发现当第6次触发data事件时,竟然距离上次触发事件隔了35ms,在随后的请求中会复

现这种现象,因此这也就导致了在并发200次查询请求时,每个请求的rt都会随之增大,并且有些响应之间间隔了30ms。

从表象看造成问题在于redis-server发送的响应不是一个数据块,而是多个数据块导致触发socket的data事件过多,而且data事件抖动过大导致响应之间存在30ms的突变(data事件是无法同时触发两次的,每次data事件处理函数执行完后才能继续触发下一个data事件);当然也有可能和socket写入(即发送req)有关,如缓存请求等。为了继续探查,监控与socket写入相关的接口 **_write()**,记录每次写入socket的数据时距离上一次写入的间隔:

提升node.js中使用redis的性能遇到的问题及解决方法

可见,在使用redis-client发送请求时,write方法也不是瓶颈。

采用同样方法,对socket的push()(该方法触发socket的data事件)进行监控,发现socket的数据到达间隔抖动非常大:

提升node.js中使用redis的性能遇到的问题及解决方法

 因此,造成redis-client并发请求下响应rt抖动较大的情况与单连接下响应数据到达本地的时刻有关,具体可能与底层libuv的缓存策略有关(笔者并未再往下探查)。

提升node.js中使用redis的性能遇到的问题及解决方法

在一个node实例中通过一个单连接与redis server通信,在高并发下会出现排队等待响应的情况,并且有可能会出现响应rt雪崩效应(如上文demo所示),因此需要尽可能减少或缓存客户端的请求数量,进行批量发送。

调优

1. pipeline(涉及到写模式及时序)
2. script

对于pipeline方式,redis server是默认支持的。通俗点说,pipeline可以合并一系列请求一次发送,并将这些请求对应的结果一次性拿到。因此这种方式可以有效减少响应次数,从而减少socket触发data事件的次数,尽可能快的拿到响应体。

提升node.js中使用redis的性能遇到的问题及解决方法

 需要强调的是,在node中,是通过底层socket的**_writev**实现一次发送多条redis命令的,_writev又叫做聚合写,它支持将不同缓冲区的多条数据通过一次系统调用写入目标流,因此性能上比每次写单个缓冲区的单个数据来的好得多。在node的Writeable对象中,有cork和uncork方法,通过这两个方法可以在node write stream中缓存多条数据,通过_writev一次性发送。

关于 _writev的数据结构

redis在拿到数据后,根据resp协议解析出命令集合缓存在队列中,直到收到exec命令,开始批量执行命令集,并将所有命令执行的结果转换为数组返回给redis client。这样就可以通过一次写、一次读实现高性能I/O。

async ()=>{
  let dd = Date.now()
  let batch = await client.batch();
  for(let i=0;i<200;i++){
    batch.get('vdWeex_com.koudai.weidian.buyer_1');
  }
  let rt = await batch.exec();
  process.exit();
}

而对于script方法,则是由redis client传入script命令,在server端执行script逻辑,批量执行命令,并返回结果。同样是一次写、一次读。

收获

1. node socket默认采用writev 集合写
2. 无依赖批量请求采用pipeline
3. eval script解决有依赖批量请求
4. redis高性能体现在服务端处理能力,但瓶颈往往出现在客户端,因此增强客户端I/O能力与并发并行多客户端才是高并发解决方案

Javascript 相关文章推荐
找出字符串中出现次数最多的字母和出现次数精简版
Nov 07 Javascript
js拖动div 当鼠标移动时整个div也相应的移动
Nov 21 Javascript
使用jQuery获取data-的自定义属性
Nov 10 Javascript
浅谈js中的引用和复制(传值和传址)
Sep 18 Javascript
AngularJS入门教程之多视图切换用法示例
Nov 02 Javascript
那些精彩的JavaScript代码片段
Jan 12 Javascript
boostrapTable的refresh和refreshOptions区别浅析
Jan 22 Javascript
JQuery EasyUI的一些常用组件
Jul 12 jQuery
通过实例学习React中事件节流防抖
Jun 17 Javascript
关于vue表单提交防双/多击的例子
Oct 31 Javascript
微信小程序scroll-view锚点链接滚动跳转功能
Dec 12 Javascript
JS实现移动端可折叠导航菜单(现代都市风)
Jul 07 Javascript
小程序云开发部署攻略(图文教程)
Oct 30 #Javascript
傻瓜式解读koa中间件处理模块koa-compose的使用
Oct 30 #Javascript
微信小程序实现单选功能
Oct 30 #Javascript
基于vue2.0实现仿百度前端分页效果附实现代码
Oct 30 #Javascript
小程序实现多选框功能
Oct 30 #Javascript
vue-cli项目配置多环境的详细操作过程
Oct 30 #Javascript
详解微信小程序中组件通讯
Oct 30 #Javascript
You might like
php+mysqli使用面向对象方式查询数据库实例
2015/01/29 PHP
强悍无比的WEB开发好助手FireBug(Firefox Plugin)
2007/01/16 Javascript
JS 实现导航栏悬停效果(续)
2013/09/24 Javascript
JavaScript中的replace()方法使用详解
2015/06/06 Javascript
老生常谈JavaScript 函数表达式
2016/09/01 Javascript
jQuery实现文档树效果
2017/02/20 Javascript
vue调用高德地图实例代码
2017/04/28 Javascript
详解ES6语法之可迭代协议和迭代器协议
2018/01/13 Javascript
vue底部加载更多的实例代码
2018/06/29 Javascript
微信小程序数据分析之自定义分析的实现
2018/08/17 Javascript
vue实现路由切换改变title功能
2019/05/28 Javascript
jquery实现自定义树形表格的方法【自定义树形结构table】
2019/07/12 jQuery
微信小程序 弹窗输入组件的实现解析
2019/08/12 Javascript
vue 翻页组件vue-flip-page效果
2020/02/05 Javascript
VSCode写vue项目一键生成.vue模版,修改定义其他模板的方法
2020/04/17 Javascript
python中__slots__用法实例
2015/06/04 Python
Python实现的RSS阅读器实例
2015/07/25 Python
使用py2exe在Windows下将Python程序转为exe文件
2016/03/04 Python
python 转换 Javascript %u 字符串为python unicode的代码
2016/09/06 Python
django模型层(model)进行建表、查询与删除的基础教程
2017/11/21 Python
python实现zabbix发送短信脚本
2018/09/17 Python
python将txt文件读入为np.array的方法
2018/10/30 Python
Golang GBK转UTF-8的例子
2019/08/26 Python
keras使用Sequence类调用大规模数据集进行训练的实现
2020/06/22 Python
Python+unittest+requests 接口自动化测试框架搭建教程
2020/10/09 Python
mac系统下安装pycharm、永久激活、中文汉化详细教程
2020/11/24 Python
纯CSS3绘制打火机动画火焰效果
2016/07/18 HTML / CSS
乌克兰设计师和品牌的服装:Love&Live
2020/04/14 全球购物
《列夫托尔斯泰》教学反思
2014/02/10 职场文书
《争吵》教学反思
2014/02/15 职场文书
党员先进事迹材料
2014/12/19 职场文书
优秀团员自我评价
2015/03/10 职场文书
冬季作息时间调整通知
2015/04/24 职场文书
退税申请报告怎么写
2015/05/18 职场文书
高中军训感想
2015/08/07 职场文书
工厂无线对讲系统解决方案
2022/02/18 无线电