Node.js中使用Buffer编码、解码二进制数据详解


Posted in Javascript onAugust 16, 2014

JavaScript很擅长处理字符串,但是因为它最初的设计是用来处理HTML文档,因此它并不太擅长处理二进制数据。JavaScript没有byte类型,没有结构化的类型(structured types),甚至没有字节数组,只有数字和字符串。(原文:JavaScript doesn't have a byte type — it just has numbers — or structured types, or http://skylitecellars.com/ even byte arrays: It just has strings.)

因为Node基于JavaScript,它自然可以处理类似HTTP这样的文本协议,但是你也可以用它来跟数据库交互,处理图片或文件上传等,可以想象,如果仅仅用字符串来做这些事得有多困难。早些时候,Node通过将byte编码成文本字符来处理二进制数据,但这种方式后来被证明并不可行,既浪费资源,又缓慢,又不灵活,而且难以维护。

Node有一个二进制缓冲实现Buffer,这个伪类(pseudo-class)提供了一系列处理二进制数据的API,简化了那些需要处理二进制数据的任务。缓冲的长度由字节数据的长度决定,而且你可以随机的设置和获取缓冲内的字节数据。

注意:Buffer类有一个特殊的地方,缓冲内的字节数据所占用的内存不是分配在JavaScrp

It VM内存堆上的,也就是说这些对象不会被JavaScript的垃圾回收算法处理,取而代之的是一个不会被修改的永久内存地址,这也避免了因缓冲内容的内存复制所造成的CPU浪费。

创建缓冲

你可以用一个UTF-8字符串创建缓冲,像这样:

var buf = new Buffer(‘Hello World!');

也可以用指定编码的字符串创建缓冲:
var buf = new Buffer('8b76fde713ce', 'base64');

可接受的字符编码和标识如下:

1.ascii——ASCI,仅适用于ASCII字符集。
2.utf8——UTF-8,这种可变宽编码适用于Unicode字符集的任何字符,它已经成了Web世界的首选编码,也是Node的默认编码类型。
3.base64——Base64,这种编码基于64个可打印ASCII字符来表示二进制数据,Base64通常用于在字符文档内嵌入可以被转化成字符串的二进制数据,在需要时又可以完整无损的转换回原来的二进制格式。

如果没有数据来初始化缓冲,可以用指定的容量大小来创建一个空缓冲:

var buf = new Buffer(1024); // 创建一个1024字节的缓冲

获取和设置缓冲数据

创建或接收一个缓冲对象后,你可能要查看或者修改它的内容,可以通过[]操作符来访问缓冲的某个字节:

var buf = new Buffer('my buffer content');

// 访问缓冲内第10个字节

console.log(buf[10]); // -> 99

注意:当你(使用缓冲容量大小来)创建一个已初始化的缓冲时,一定要注意,缓冲的数据并没有被初始化成0,而是随机数据。

var buf = new Buffer(1024);
console.log(buf[100]); // -> 5 (某个随机值)

你可以这样修改缓冲里任何位置的数据:

buf[99] = 125; // 把第100个字节的值设置为125

注意:在某些情况下,一些缓冲操作并不会产生错误,比如:

1.缓冲内的字节最大值为255,如果某个字节被赋予大于256的数字,将会用256对其取模,然后将结果赋给这个字节。
2.如果将缓冲的某个字节赋值为256,它的实际值将会是0(译者注:其实跟第一条重复,256%256=0)
3.如果用浮点数给缓冲内某个字节赋值,比如100.7,实际值将会是浮点数的整数部分——100
4.如果你尝试给一个超出缓冲容量的位置赋值,赋值操作将会失败,缓冲不做任何修改。

你可以用length属性获取缓冲的长度:

var buf = new Buffer(100);
console.log(buf.length); // -> 100

还可以使用缓冲长度迭代缓冲的内容,来读取或设置每个字节:

var buf = new Buffer(100);
for(var i = 0; i < buf.length; i++) {
    buf[i] = i;
}

上面代码新建了一个包含100个字节的缓冲,并从0到99设置了缓冲内每个字节。

切分缓冲数据

一旦创建或者接收了一个缓冲,你可能需要提取缓冲数据的一部分,可以通过指定起始位置来切分现有的缓冲,从而创建另外一个较小的缓冲:

var buffer = new Buffer("this is the content of my buffer");
var smallerBuffer = buffer.slice(8, 19);
console.log(smallerBuffer.toString()); // -> "the content"

注意,当切分一个缓冲的时候并没有新的内存被分配或复制,新的缓冲使用父缓冲的内存,它只是父缓冲某段数据(由起始位置指定)的引用。这段话含有几个意思。

首先,如果你的程序修改了父缓冲的内容,这些修改也会影响相关的子缓冲,因为父缓冲和子缓冲是不同的JavaScript对象,因此很容易忽略这个问题,并导致一些潜在的bug。

其次,当你用这种方式从父缓冲创建一个较小的子缓冲时,父缓冲对象在操作结束后依然会被保留,并不会被垃圾回收,如果不注意的话,很容易会造成内存泄露。

注意:如果你担心因此产生内存泄露问题,你可以使用copy方法来替代slice操作,下面将会介绍copy。

复制缓冲数据

你可以像这样用copy将缓冲的一部分复制到另外一个缓冲:

var buffer1 = new Buffer("this is the content of my buffer");
var buffer2 = new Buffer(11);
var targetStart = 0;
var sourceStart = 8;
var sourceEnd = 19;
buffer1.copy(buffer2, targetStart, sourceStart, sourceEnd);
console.log(buffer2.toString()); // -> "the content"

上面代码,复制源缓冲的第9到20个字节到目标缓冲的开始位置。

解码缓冲数据

缓冲数据可以这样转换成一个UTF-8字符串:

var str = buf.toString();

还可以通过指定编码类型来将缓冲数据解码成任何编码类型的数据。比如,你想把一个缓冲解码成base64字符串,可以这么做:

var b64Str = buf.toString("base64");

使用toString函数,你还可以把一个UTF-8字符串转码成base64字符串:
var utf8String = 'my string';
var buf = new Buffer(utf8String);
var base64String = buf.toString('base64')

小结

有时候,你不得不跟二进制数据打交道,但是原生JavaScript又没有明确的方式来做这件事,于是Node提供了Buffer类,封装了一些针对连续内存块的操作。你可以在两个缓冲之间切分或复制内存数据。

你也可以把一个缓冲转换成某种编码的字符串,或者反过来,把一个字符串转化成缓冲,来访问或处理每个bit。

Javascript 相关文章推荐
javascript之解决IE下不渲染的bug
Jun 29 Javascript
javascript函数以及基础写法100多条实用整理
Jan 13 Javascript
关于extjs treepanel复选框选中父节点与子节点的问题
Apr 02 Javascript
Vue.js第三天学习笔记(计算属性computed)
Dec 01 Javascript
[原创]SyntaxHighlighter自动识别并加载脚本语言
Feb 07 Javascript
移动端web滚动分页的实现方法
May 05 Javascript
Angularjs在360兼容模式下取数据缓存问题的解决办法
Jun 22 Javascript
Vue动态控制input的disabled属性的方法
Jun 26 Javascript
JavaScript引用类型Array实例分析
Jul 24 Javascript
详解keep-alive + vuex 让缓存的页面灵活起来
Apr 19 Javascript
tsconfig.json配置详解
May 17 Javascript
Vue数据双向绑定原理实例解析
May 15 Javascript
Node.js中创建和管理外部进程详解
Aug 16 #Javascript
Node.js模块加载详解
Aug 16 #Javascript
JS遍历Json字符串中键值对先转成JSON对象再遍历
Aug 15 #Javascript
手机端网页点击链接触发自动拨打或保存电话的示例代码
Aug 15 #Javascript
Node.js中使用事件发射器模式实现事件绑定详解
Aug 15 #Javascript
Node.js中使用计时器定时执行函数详解
Aug 15 #Javascript
javascript中实现兼容JAVA的hashCode算法代码分享
Aug 11 #Javascript
You might like
PHP XML备份Mysql数据库
2009/05/27 PHP
php 无限分类的树类代码
2009/12/03 PHP
php 文章采集正则代码
2009/12/28 PHP
PHP中的integer类型使用分析
2010/07/27 PHP
MySQL连接数超过限制的解决方法
2011/07/17 PHP
php提示Call-time pass-by-reference has been deprecated in的解决方法[已测]
2012/05/06 PHP
php引用和拷贝的区别知识点总结
2019/09/23 PHP
PHP 计算至少是其他数字两倍的最大数的实现代码
2020/05/26 PHP
使用JS 清空File控件的路径值
2013/07/08 Javascript
js左侧三级菜单导航实例代码
2013/09/13 Javascript
node.js中的fs.lchownSync方法使用说明
2014/12/16 Javascript
使用jquery提交form表单并自定义action的实现代码
2016/05/25 Javascript
AngularJs ng-route路由详解及实例代码
2016/09/14 Javascript
Vue-component全局注册实例
2018/09/06 Javascript
微信小程序框架wepy之动态控制类名
2018/09/14 Javascript
微信小程序引入VANT组件的方法步骤
2019/09/19 Javascript
详解javascript中var与ES6规范中let、const区别与用法
2020/01/11 Javascript
[01:15:00]LGD vs Mineski Supermajor 胜者组 BO3 第一场 6.5
2018/06/06 DOTA
[33:23]Secret vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.16
2018/08/17 DOTA
python实现博客文章爬虫示例
2014/02/26 Python
python3爬取数据至mysql的方法
2018/06/26 Python
python判断完全平方数的方法
2018/11/13 Python
Python 保持登录状态进行接口测试的方法示例
2019/08/06 Python
CSS3图片旋转特效(360/60/-360度)
2013/10/10 HTML / CSS
诺心蛋糕官网:LE CAKE
2018/08/25 全球购物
Lentiamo丹麦:购买便宜的隐形眼镜
2021/01/13 全球购物
嘻哈珠宝品牌:KRKC&CO
2020/10/19 全球购物
shell程序如何生命变量?shell变量是弱变量吗?
2014/11/10 面试题
职业教育毕业生求职信
2013/11/09 职场文书
自荐书封面下载
2013/11/29 职场文书
售后主管岗位职责
2013/12/08 职场文书
网络工程师职业规划
2014/02/10 职场文书
小学生倡议书范文
2014/05/13 职场文书
2015公司年度工作总结
2015/05/14 职场文书
浅谈Python实现opencv之图片色素的数值运算和逻辑运算
2021/06/23 Python
win11开机发生死循环重启怎么办?win11开机发生死循环重启解决方法
2022/08/05 数码科技