编程 Javascript

提升node.js中使用redis的性能遇到的问题及解决方法

Posted in Javascript onOctober 30, 2018

问题初现

某基于node.js开发的业务系统向外提供了一个dubbo服务，提供向第三方缓存查询、设置多项业务数据并聚合操作结果。在QPS达到800时（两台虚拟机，每台机器4Core8G4node进程），在监控平台上出现了非常多的slow rt警告，平均接口响应达到60+ms，请求报警率达到80%+。

为找到造成该服务吞吐量过低的罪魁祸首，业务人员在请求日志中打点了所有查询缓存的操作，结果显示每个请求查询缓存耗时在50-100ms之间跳动。查询了redis-server的监控数据发现，不存在server端的慢查询，在整个监控区间内服务端处理时间在40us徘徊，因此排除了redis-server的处理能力不足原因；

通过登录内网机器进行不断测试到对应redis server机器的端到端时延发现内部局域网的带宽、时延与抖动足够正常，都不是造成该问题的原因。

因此，错误原因定位到了调用redis client的业务代码以及redis client的I/O性能。

本文中提到的node redis client采用的基于node-redis封装的二方包，因此问题排查也基于node-redis这个模块。

瓶颈在哪

为了在本地模拟线上环境的并发，可以做一个不是很严谨的测试：

async ()=>{
  let dd = Date.now()
  let arr = []
  for(let i=0;i<200;i++){
    arr.push(new Promise((res,rej)=>{
      let hrtime = process.hrtime();
      client.send_command('get',['key'], function(e,r) {
      let diff = process.hrtime(hrtime);
      let cost = (diff[0] * NS_PER_SEC + diff[1])/1000000;
      console.log(`final: ${cost} ms`)
      res();
      });
    }));
  }
  await Promise.all(arr)
  console.log('ops/sec:',200*1000/(Date.now() - dd),Date.now() - dd);
}

会发现每个请求的rt都会比前一个请求来的大

提升node.js中使用redis的性能遇到的问题及解决方法

最后一个请求的rt竟然达到了257 ms！虽然在node单进程像示例代码那样并发执行200次get请求是非常少见而且愚蠢的（关于示例代码的优化在在下节讲述），但是针对这个示例必须找到请求delay增加的原因。

为此继续分析，redis client采用的是单连接模式，底层采用的非阻塞网络I/O，socket.recv()在node层面是通过监听socket的data事件完成的，因此先分析redis-client读性能如何：

提升node.js中使用redis的性能遇到的问题及解决方法

上图每段日志的含义分别表示：

- data events trigger times: socket data事件触发的次数
- data event start from prevent event: data事件距离上次触发的时间间隔
- data events exec time(ms): 本次事件处理函数执行时间

上图只是截取了最初的请求日志，发现当第6次触发data事件时，竟然距离上次触发事件隔了35ms，在随后的请求中会复

现这种现象，因此这也就导致了在并发200次查询请求时，每个请求的rt都会随之增大，并且有些响应之间间隔了30ms。

从表象看造成问题在于redis-server发送的响应不是一个数据块，而是多个数据块导致触发socket的data事件过多，而且data事件抖动过大导致响应之间存在30ms的突变（data事件是无法同时触发两次的，每次data事件处理函数执行完后才能继续触发下一个data事件）；当然也有可能和socket写入（即发送req）有关，如缓存请求等。为了继续探查，监控与socket写入相关的接口 **_write()**,记录每次写入socket的数据时距离上一次写入的间隔：

提升node.js中使用redis的性能遇到的问题及解决方法

可见，在使用redis-client发送请求时，write方法也不是瓶颈。

采用同样方法，对socket的push()（该方法触发socket的data事件）进行监控，发现socket的数据到达间隔抖动非常大：

提升node.js中使用redis的性能遇到的问题及解决方法

因此，造成redis-client并发请求下响应rt抖动较大的情况与单连接下响应数据到达本地的时刻有关，具体可能与底层libuv的缓存策略有关（笔者并未再往下探查）。

提升node.js中使用redis的性能遇到的问题及解决方法

在一个node实例中通过一个单连接与redis server通信，在高并发下会出现排队等待响应的情况，并且有可能会出现响应rt雪崩效应（如上文demo所示），因此需要尽可能减少或缓存客户端的请求数量，进行批量发送。

调优

1. pipeline(涉及到写模式及时序)
2. script

对于pipeline方式，redis server是默认支持的。通俗点说，pipeline可以合并一系列请求一次发送，并将这些请求对应的结果一次性拿到。因此这种方式可以有效减少响应次数，从而减少socket触发data事件的次数，尽可能快的拿到响应体。

提升node.js中使用redis的性能遇到的问题及解决方法

需要强调的是，在node中，是通过底层socket的**_writev**实现一次发送多条redis命令的，_writev又叫做聚合写，它支持将不同缓冲区的多条数据通过一次系统调用写入目标流，因此性能上比每次写单个缓冲区的单个数据来的好得多。在node的Writeable对象中，有cork和uncork方法，通过这两个方法可以在node write stream中缓存多条数据，通过_writev一次性发送。

关于 _writev的数据结构

redis在拿到数据后，根据resp协议解析出命令集合缓存在队列中，直到收到exec命令，开始批量执行命令集，并将所有命令执行的结果转换为数组返回给redis client。这样就可以通过一次写、一次读实现高性能I/O。

async ()=>{
  let dd = Date.now()
  let batch = await client.batch();
  for(let i=0;i<200;i++){
    batch.get('vdWeex_com.koudai.weidian.buyer_1');
  }
  let rt = await batch.exec();
  process.exit();
}

而对于script方法，则是由redis client传入script命令，在server端执行script逻辑，批量执行命令，并返回结果。同样是一次写、一次读。

收获

1. node socket默认采用writev 集合写
2. 无依赖批量请求采用pipeline
3. eval script解决有依赖批量请求
4. redis高性能体现在服务端处理能力，但瓶颈往往出现在客户端，因此增强客户端I/O能力与并发并行多客户端才是高并发解决方案

提升node.js中使用redis的性能遇到的问题及解决方法

- Author -

royalrover

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Javascript 相关文章推荐

js数据验证集合、js email验证、js url验证、js长度验证、js数字验证等简单封装

May 15 Javascript

juqery 学习之四筛选查找

Nov 30 Javascript

基于jquery点击自以外任意处，关闭自身的代码

Feb 10 Javascript

Javascript表格翻页效果的具体实现

Oct 05 Javascript

浅谈window对象的scrollBy()方法

Jul 15 Javascript

谈一谈javascript闭包

Jan 28 Javascript

浅谈Vue数据绑定的原理

Jan 08 Javascript

如何快速解决JS或Jquery ajax异步跨域的问题

Jan 08 jQuery

详解Angular中实现自定义组件的双向绑定的两种方法

Nov 23 Javascript

微信小程序云开发之云函数详解

May 16 Javascript

vue将后台数据时间戳转换成日期格式

Jul 31 Javascript

JavaScript用document.write()输出换行的示例代码

Nov 26 Javascript

小程序云开发部署攻略(图文教程)

Oct 30 #Javascript

傻瓜式解读koa中间件处理模块koa-compose的使用

Oct 30 #Javascript

微信小程序实现单选功能

Oct 30 #Javascript

基于vue2.0实现仿百度前端分页效果附实现代码

Oct 30 #Javascript

小程序实现多选框功能

Oct 30 #Javascript

vue-cli项目配置多环境的详细操作过程

Oct 30 #Javascript

详解微信小程序中组件通讯

Oct 30 #Javascript

You might like

php遍历目录与文件夹的多种方法详解

2013/11/14 PHP

PHP生成plist数据的方法

2015/06/16 PHP

详解php语言最牛掰的Laravel框架

2017/11/20 PHP

javascript 面向对象全新理练之继承与多态

2009/12/03 Javascript

js获取height和width的方法说明

2013/01/06 Javascript

JS实现div内部的文字或图片自动循环滚动代码

2013/04/19 Javascript

javascript 使用for循环时该注意的问题-附问题总结

2015/08/19 Javascript

SpringMVC返回json数据的三种方式

2015/12/10 Javascript

微信jssdk在iframe页面失效问题的解决措施

2016/03/03 Javascript

jQuery解决input元素的blur事件和其他非表单元素的click事件冲突问题

2016/08/15 Javascript

javascript 的变量、作用域和内存问题

2017/04/19 Javascript

ionic实现底部分享功能

2017/05/11 Javascript

js排序与重组的实例讲解

2017/08/28 Javascript

jQuery选择器之子元素选择器详解

2017/09/18 jQuery

vue.js实现简单轮播图效果

2017/10/10 Javascript

JS实现生成由字母与数字组合的随机字符串功能详解

2018/05/25 Javascript

JavaScript插入排序算法原理与实现方法示例

2018/08/06 Javascript

bootstrap里bootstrap动态加载下拉框的实例讲解

2018/08/10 Javascript

js序列化和反序列化的使用讲解

2019/01/19 Javascript

vue cli3.0结合echarts3.0与地图的使用方法示例

2019/03/26 Javascript

python删除列表中重复记录的方法

2015/04/28 Python

python3实现ftp服务功能（客户端）

2017/03/24 Python

新手如何快速入门Python(菜鸟必看篇)

2017/06/10 Python

从训练好的tensorflow模型中打印训练变量实例

2020/01/20 Python

python词云库wordCloud使用方法详解(解决中文乱码)

2020/02/17 Python

Python图像处理库PIL的ImageEnhance模块使用介绍

2020/02/26 Python

python 获取当前目录下的文件目录和文件名实例代码详解

2020/03/10 Python

实例讲解CSS3中的border-radius属性

2015/08/18 HTML / CSS

美国杰西潘尼官网：JCPenney

2019/06/12 全球购物

介绍一下代理模式(Proxy)

2014/10/17 面试题

new修饰符是起什么作用

2015/06/28 面试题

仓库管理制度

2014/01/21 职场文书

运动会100米解说词

2014/01/23 职场文书

vue选项卡切换的实现案例

2022/04/11 Vue.js

python双向链表实例详解

2022/05/25 Python

python如何读取和存储dict()与.json格式文件

2022/06/25 Python