深入浅出了解Node.js Streams


Posted in Javascript onMay 27, 2019

什么是流(steams)

流(stream)是 Node.js 中处理流式数据的抽象接口。

Streams 不是 Node.js 独有的概念。它们是几十年前在 Unix 操作系统中引入的。

它们能够以一种有效的方式来处理文件的读、写,网络通信或任何类型的端到端信息交换。
例如,当你编写了一段程序用来读取文件时,传统的方法是将文件从头到尾读入内存,然后再进行处理。而使用流的话,你就可以逐块读取它,处理其内容而不将其全部保存在内存中。
以如下代码为例

const fs = require('fs');
const rs = fs.createReadStream('test.md');
let data = '';
rs.on("data", function (chunk) {
data += chunk;
});
rs.on("end", function() {
console.log(data);
});

利用 createReadStream 创建一个读取数据的流,来读取 test.md 文件的内容,此时监听 data 事件,它是在当流将数据块传送给消费者后触发。并在对应的 eventHandler 中,拼接 chunk。在 end 事件中,打印到终端上。
之前说流,可以逐块读取文件内容,那么这个块,也就是 chunk 是什么?
一般情况下是 Buffer,修改 data 事件的 eventHandler 来验证下

rs.on("data", function (chunk) {
console.log("chunk", Buffer.isBuffer(chunk)) // log true
data += chunk;
});

流的工作方式可以具体的表述为,在内存中准备一段 Buffer,然后在 fs.read() 读取时逐步从磁盘中将字节复制到 Buffer 中。

为什么要使用 Stream

利用 Stream 来处理数据,主要是因为它的两个优点:

内存效率:在够处理数据之前,不需要占用大量内存;

时间效率:处理数据花费的时间更少,因为流是逐块来处理数据,而不是等到整个数据有效负载才启动。

首先内存效率,与 fs.readFile 这种会缓冲整个文件相比,流式传输充分地利用 Buffer (超过 8kb)不受 V8 内存控制的特点,利用堆外内存完成高效地传输。相关验证可以参考这篇博文,地址。
时间效率,与 fs.FileSync 相比,有些优势,但是与异步的 fs.readFile 相比,优势不大。

Node.js 中 Stream 的使用

首先用一张图来了解下 Node.js 中有哪些内置的 Stream 接口

深入浅出了解Node.js Streams

图中提供了一些 Node.js 原生的流的示例,有些是可读、写的流。 也有一些是可读写的流,如 TCP sockets、zlib 以及 crypto。

特别注意: 流的读、写与环境是密切相关的。例如 HTTP 响应在客户端上的可读流,但它是服务器上的可写流。同时还需要注意,stdio streams(stdin,stdout,stderr) 在子进程上是相反的流。

使用一个例子来展示流的使用

首先利用如下脚本创建一个比较大的文件(大概 430 MB)

const fs = require('fs');
const file = fs.createWriteStream('test.md');
for(let i=0; i<= 1e6; i++) {
file.write('hello world.\n');
}
file.end();

在当前目录下,启动 http 服务

const http = require('http')
const fs = require('fs')
const server = http.createServer(function (req, res) {
fs.readFile(__dirname + '/test.md', (err, data) => {
res.end(data)
})
})
server.listen(3000)

得到的结果,如图

深入浅出了解Node.js Streams

const http = require('http')
const fs = require('fs')
const server = http.createServer((req, res) => {
const stream = fs.createReadStream(__dirname + '/test.md')
stream.pipe(res)
})
server.listen(3000)

深入浅出了解Node.js Streams

时间减少了 2s 多。这可以解释为,在读取文件内容,并且不需要改变内容的场景下,流能够完成只读取 buffer,然后直接传输,不做额外的转换,避免损耗,提高性能。
上述代码中,应用了 stream.pipe(...) 。它主要是对流进行链式地管道操作,例如

src.pipe(dest1).pipe(dest2)

这样数据流会被自动管理。

如果可读流发生错误,目标可写流不会自动关闭,需要手动关闭所有流以避免内存泄漏。

通常,当你使用 pipe 方法时,就不需要使用事件,但如果场景需要以更灵活、自定义的方式使用流,那么就要考虑事件。

Stream events

在上述例子中,我们使用了可读流的 data 、end 事件来控制文件的读取,它本质上与 pipe 方法相同,例如

# readable.pipe(writable)
readable.on('data', (chunk) => {
writable.write(chunk);
});
readable.on('end', () => {
writable.end();
});

只不过,使用 event 会更加灵活,可控。

深入浅出了解Node.js Streams

图中简单罗列了可读流、可写流的相关事件、方法,其中最重要的是

可读流:

  • data 事件:每当流将一大块数据传递时,就会触发;
  • end 事件:当没有更多数据要从流发出时,就会触发。

可写流:

  • drain 事件:当可以继续写入数据到流时会触发事件;
  • finish 事件:处理完全部数据块之后触发。

流的不同类型

除了上面涉及到的可读、写流之后,还有 Duplex、Transform 两类:

  • Readable :可以接收数据,但不能向其发送数据。当你将数据推送到可读流中时,它会被缓冲,直到消费者开始读取数据;
  • writable :可以发送数据,但不能从中接收;
  • Duplex :即可读也可写;
  • Tranform :与 Duplex 一样是可写又可读的,但它的输出与输入是相关联的。

如何创建一个可读流

这里只做简单介绍,具体见 stream module。

const Stream = require('stream')
const readableStream = new Stream.Readable()
readableStream._read = (size) => {
console.log('read', size)
}

利用 Stream 模块初始化一个可读流,然后向其中发送数据

readableStream.push('hi!')
readableStream.push('ho!')

如何创建一个可写流

为了创建可写流,需要扩展了基本的 Writable 对象,并实现了它的 _write 方法。

const Stream = require('stream')
const writableStream = new Stream.Writable()

实现 _write 方法:

writableStream._write = (chunk, encoding, next) => {
console.log(chunk.toString())
next()
}

结合上述例子实现

利用 readableStream 读入数据,并输出到 writableStream

const Stream = require('stream')
const readableStream = new Stream.Readable()
readableStream._read = (size) => {
console.log('read', size)
}
const writableStream = new Stream.Writable()
writableStream._write = (chunk, encoding, next) => {
console.log('write', chunk.toString())
next()
}
readableStream.pipe(writableStream)
readableStream.push('hi!')
readableStream.push('ho!')
/* 
log:
read 16384
write hi!
write ho!
*/

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Javascript 相关文章推荐
JavaScript操纵窗口的方法小结
Jun 28 Javascript
浅谈JavaScript中定义变量时有无var声明的区别
Aug 18 Javascript
原生js实现图片层叠轮播切换效果
Feb 02 Javascript
微信小程序 图片等比例缩放(图片自适应屏幕)
Nov 16 Javascript
学习vue.js中class与style绑定
Dec 03 Javascript
微信小程序 页面之间传参实例详解
Jan 13 Javascript
vue-cli单页应用改成多页应用配置详解
Jul 14 Javascript
详解webpack-dev-server使用方法
Sep 14 Javascript
关于layui导航栏不展示下拉列表的解决方法
Sep 25 Javascript
vue+导航锚点联动-滚动监听和点击平滑滚动跳转实例
Nov 13 Javascript
使用JavaScript通过前端发送电子邮件
May 22 Javascript
.netcore+vue 实现压缩文件下载功能
Sep 24 Javascript
JavaScript怎样在删除前添加确认弹出框?
May 27 #Javascript
vue项目前端错误收集之sentry教程详解
May 27 #Javascript
了解javascript中变量及函数的提升
May 27 #Javascript
基于vue实现一个禅道主页拖拽效果
May 27 #Javascript
jQuery实现input输入框获取焦点与失去焦点时提示的消失与显示功能示例
May 27 #jQuery
初学node.js中实现删除用户路由
May 27 #Javascript
jquery实现动态创建form并提交的方法示例
May 27 #jQuery
You might like
ftp类(myftp.php)
2006/10/09 PHP
PHP实现的XML操作类【XML Library】
2016/12/29 PHP
Laravel统一错误处理为JSON的方法介绍
2020/10/18 PHP
如何减少浏览器的reflow和repaint
2015/02/26 Javascript
基于Jquery实现表单验证
2020/07/20 Javascript
13个PHP函数超实用
2015/10/21 Javascript
JavaScript中的时间处理小结
2016/02/24 Javascript
使用jquery.qrcode.js生成二维码插件
2016/10/17 Javascript
Bootstrap输入框组件简单实现代码
2017/03/06 Javascript
js实现3D图片展示效果
2017/03/09 Javascript
Javascript刷新页面的实例
2017/09/23 Javascript
微信小程序页面调用自定义组件内的事件详解
2019/09/12 Javascript
ES6使用新特性Proxy实现的数据绑定功能实例
2020/05/11 Javascript
Angular利用HTTP POST下载流文件的步骤记录
2020/07/26 Javascript
OpenLayers实现图层切换控件
2020/09/25 Javascript
Python编程实现数学运算求一元二次方程的实根算法示例
2017/04/02 Python
python 数据的清理行为实例详解
2017/07/12 Python
python 函数传参之传值还是传引用的分析
2017/09/07 Python
利用python编写一个图片主色转换的脚本
2017/12/07 Python
Python cookbook(数据结构与算法)找到最大或最小的N个元素实现方法示例
2018/02/13 Python
python执行CMD指令,并获取返回的方法
2018/12/19 Python
Python OpenCV调用摄像头检测人脸并截图
2020/08/20 Python
python-序列解包(对可迭代元素的快速取值方法)
2019/08/24 Python
pytorch masked_fill报错的解决
2020/02/18 Python
jupyter notebook 参数传递给shell命令行实例
2020/04/10 Python
pandas读取csv文件提示不存在的解决方法及原因分析
2020/04/21 Python
新闻专业大学生找工作的自我评价
2013/10/30 职场文书
幼儿园中班新学期寄语
2014/01/18 职场文书
企业年度评优方案
2014/06/02 职场文书
房产转让协议书(2014版)
2014/09/30 职场文书
银行贷款收入证明
2014/10/17 职场文书
校本课程教学计划
2015/01/19 职场文书
2015年创先争优活动总结
2015/03/27 职场文书
《和时间赛跑》读后感3篇
2019/12/16 职场文书
Python文件的操作示例的详细讲解
2021/04/08 Python
用Python制作灯光秀短视频的思路详解
2021/04/13 Python