NodeJS模块Buffer原理及使用方法解析


Posted in NodeJs onNovember 11, 2020

Buffer 作为 nodejs 中重要的概念和功能,为开发者提供了操作二进制的能力。本文记录了几个问题,来加深对 Buffer 的理解和使用:

  • 认识缓冲器
  • 如何申请堆外内存
  • 如何计算字节长度
  • 如何计算字节长度
  • 如何转换字符编码
  • 理解共享内存与拷贝内存

认识 Buffer(缓冲器)

Buffer 是 nodejs 核心 API,它提供我们处理二进制数据流的功能。Buffer 的使用和 ES2017 的 Uint8Array 非常相似,但由于 node 的特性,专门提供了更深入的 api。

Uint8Array 的字面意思就是:8 位无符号整型数组。一个字节是 8bit,而字节的表示也是由两个 16 进制(4bit)的数字组成的。

const buf = Buffer.alloc(1);
console.log(buf); // output: <Buffer 00>

如何申请堆外内存

Buffer 可以跳出 nodejs 对堆内内存大小的限制。nodejs12 提供了 4 种 api 来申请堆外内存:

  • Buffer.from()
  • Buffer.alloc(size[, fill[, encoding]])
  • Buffer.allocUnsafe(size)
  • Buffer.allocUnsafeSlow(size)

Buffer.alloc vs Buffer.allocUnsafe

在申请内存时,可能这片内存之前存储过其他数据。如果不清除原数据,那么会有数据泄漏的安全风险;如果清除原数据,速度上会慢一些。具体用哪种方式,根据实际情况定。

  • Buffer.alloc:申请指定大小的内存,并且清除原数据,默认填充 0
  • Buffer.allocUnsafe:申请指定大小内存,但不清除原数据,速度更快

根据提供的 api,可以手动实现一个alloc:

function pollifyAlloc(size, fill = 0, encoding = "utf8") {
  const buf = Buffer.allocUnsafe(size);
  buf.fill(fill, 0, size, encoding);
  return buf;
}

Buffer.allocUnsafe vs Buffer.allocUnsafeSlow

从命名上可以直接看出效果,Buffer.allocUnsafeSlow更慢。因为当使用 Buffer.allocUnsafe 创建新的 Buffer 实例时,如果要分配的内存小于 4KB,则会从一个预分配的 Buffer 切割出来。 这可以避免垃圾回收机制因创建太多独立的 Buffer 而过度使用。

这种方式通过消除跟踪和清理的需要来改进性能和内存使用。

如何计算字节长度

利用 Buffer,可以获得数据的真实所占字节。例如一个汉字,它的字符长度是 1。但由于是 utf8 编码的汉字,所以占用 3 个字节。

直接利用Buffer.byteLength()可以获得字符串指定编码的字节长度:

const str = "本文原文地址: xxoo521.com";

console.log(Buffer.byteLength(str, "utf8")); // output: 31
console.log(str.length); // output: 19

也可以直接访问 Buffer 实例的 length 属性(不推荐):

console.log(Buffer.from(str, "utf8").length); // output: 31

如何转换字符编码

Nodejs 当前支持的编码格式有:ascii、utf8、utf16le、ucs2、base64、latin1、binary、hex。其他编码需要借助三方库来完成。

下面,是用Buffer.from()和buf.toString()来封装的 nodejs 平台的编码转换函数:

function trans(str, from = "utf8", to = "utf8") {
  const buf = Buffer.from(str, from);
  return buf.toString(to);
}

// output: 5Y6f5paH5Zyw5Z2AOiB4eG9vNTIxLmNvbQ==
console.log(trans("原文地址: xxoo521.com", "utf8", "base64"));

共享内存与拷贝内存

在生成 Buffer 实例,操作二进制数据的时候,千万要注意接口是基于共享内存,还是基于拷贝底层内存。

例如对于生成 Buffer 实例的from(),不同类型的参数,nodejs 底层的行为是不同的。

为了更形象地解释,请看下面两段代码。

代码 1:

const buf1 = Buffer.from("buffer");
const buf2 = Buffer.from(buf1); // 拷贝参数中buffer的数据到新的实例
buf1[0]++;

console.log(buf1.toString()); // output: cuffer
console.log(buf2.toString()); // output: buffer

代码 2:

const arr = new Uint8Array(1);
arr[0] = 97;

const buf1 = Buffer.from(arr.buffer);
console.log(buf1.toString()); // output: a

arr[0] = 98;
console.log(buf1.toString()); // output: b

在第二段代码中,传入Buffer.from的参数类型是arrayBuffer。因此Buffer.from仅仅是创建视图,而不是拷贝底层内存。buf1 和 arr 的内存是共享的。

在操作 Buffer 的过程中,需要特别注意共享和拷贝的区别,发生错误比较难排查。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

NodeJs 相关文章推荐
nodejs 后缀名判断限制代码
Mar 31 NodeJs
Nodejs使用mysql模块之获得更新和删除影响的行数的方法
Mar 18 NodeJs
nodejs分页类代码分享
Jun 17 NodeJs
nodejs修复ipa处理过的png图片
Feb 17 NodeJs
Nodejs中 npm常用命令详解
Jul 04 NodeJs
NodeJS测试框架mocha入门教程
Mar 28 NodeJs
3分钟快速搭建nodejs本地服务器方法运行测试html/js
Apr 01 NodeJs
详解Nodejs之静态资源处理
Jun 05 NodeJs
NodeJS自定义模块写法(详解)
Jun 27 NodeJs
nodejs实现OAuth2.0授权服务认证
Dec 27 NodeJs
nodejs的路径问题的解决
Jun 30 NodeJs
nodejs微信开发之授权登录+获取用户信息
Mar 17 NodeJs
nodejs中内置模块fs,path常见的用法说明
Nov 07 #NodeJs
Nodejs + sequelize 实现增删改查操作
Nov 07 #NodeJs
nodejs+koa2 实现模仿springMVC框架
Oct 21 #NodeJs
nodejs使用Sequelize框架操作数据库的实现
Oct 21 #NodeJs
用Nodejs实现在终端中炒股的实现
Oct 18 #NodeJs
Nodejs在局域网配置https访问的实现方法
Oct 17 #NodeJs
NodeJS开发人员常见五个错误理解
Oct 14 #NodeJs
You might like
PHP的变量总结 新手推荐
2011/04/18 PHP
PHP的简易冒泡法代码分享
2012/08/28 PHP
php中使用临时表查询数据的一个例子
2013/02/03 PHP
php文件夹的创建与删除方法
2015/01/24 PHP
laravel框架查询数据集转为数组的两种方法
2019/10/10 PHP
JQuery做的一个简单的点灯游戏分享
2014/07/16 Javascript
Javascript实现计算个人所得税
2015/05/10 Javascript
JS实现网站菜单拖拽移位效果的方法
2015/09/24 Javascript
JS实现兼容各种浏览器的获取选择文本的方法【测试可用】
2016/06/21 Javascript
WEB前端实现裁剪上传图片功能
2016/10/17 Javascript
js实现的简练高效拖拽功能示例
2016/12/21 Javascript
JS完成画圆圈的小球
2017/03/07 Javascript
解决vue router使用 history 模式刷新后404问题
2017/07/19 Javascript
vue中引用阿里字体图标的方法
2018/02/10 Javascript
[01:18]PWL开团时刻DAY4——圣剑与抢盾
2020/11/03 DOTA
简单总结Python中序列与字典的相同和不同之处
2016/01/19 Python
Python正则表达式完全指南
2017/05/25 Python
python获取代码运行时间的实例代码
2018/06/11 Python
python+opencv实现阈值分割
2018/12/26 Python
python 实现一次性在文件中写入多行的方法
2019/01/28 Python
Flask框架路由和视图用法实例分析
2019/11/07 Python
浅析Python3 pip换源问题
2020/01/06 Python
Python内置数据类型list各方法的性能测试过程解析
2020/01/07 Python
Python如何批量获取文件夹的大小并保存
2020/03/31 Python
django 实现简单的插入视频
2020/04/07 Python
建筑工程实习自我鉴定
2013/09/19 职场文书
大学四年职业生涯规划书范文
2014/01/02 职场文书
《乞巧》教学反思
2014/02/27 职场文书
学习两会精神心得范文
2014/03/17 职场文书
物业管理专业自荐信
2014/07/01 职场文书
辞旧迎新演讲稿
2014/09/15 职场文书
redis 限制内存使用大小的实现
2021/05/08 Redis
MySQL 分页查询的优化技巧
2021/05/12 MySQL
80行代码写一个Webpack插件并发布到npm
2021/05/24 Javascript
springBoot基于webSocket实现扫码登录
2021/06/22 Java/Android
叶县这家生产军用电台的兵工厂,人称“四机部”,走出一上将
2022/02/18 无线电