利用Node.js如何实现文件循环覆写


Posted in Javascript onApril 05, 2019

前言

这次编写Node.js项目的时候用到了日志模块,其中碰到了一个小问题。

这是一个定时执行可配置自动化任务的项目,所以输出信息会不断增加,也就意味着日志文件会随时间不断增大。如果对日志文件大小不加以控制,那么服务器的磁盘迟早会被撑满。所以限制文件大小是有必要的。

最理想的控制方式就是当文件大小超过限制时,清除最先记录的数据。类似一个FIFO的队列。

# 删除前面的数据
- 1 xxx
 ......
 100 abc
# 文件末尾追加数据
+ 101 xxxx

log4js的file rolling

一提到记录日志很多Node.js开发者肯定会找到log4js,先来看看log4js是怎么处理这个问题的。

log4js分为很多appenders(可以理解为记录日志的媒介),file rolling功能可以通过函数来进行配置。

file rolling功能有两种方式:日期和文件大小。

要控制文件大小,当然选择后者。

为了测试这个功能是否满足我们要求,写一段循环代码来写日志。

const log4js = require('log4js')
// 配置log4js
log4js.configure({
 appenders: {
 everything: {
 type: 'file',
 filename: 'a.log',
 maxLogSize: 1000,
 backups: 0
 },
 },
 categories: {
 default: {
 appenders: ['everything'],
 level: 'debug'
 }
 }
});
const log = log4js.getLogger();
for (let i = 0; i < 41; i++) {
 const str = i.toString().padStart(6, '000000');
 log.debug(str);
}

执行之后生成两个文件a.log和a.log.1。

其中a.log.1有20行数据,实际大小1kb,a.log只有1行数据。

虽然确实控制了文件大小,但是会带来两个问题:

  • 额外产生一个备份文件,总占用磁盘空间会超过文件限制。
  • 日志文件内容的大小是变动的,查询日志的时候很可能需要联合备份文件进行查询(比如上面的情况日志文件只有1行数据)。

推测log4js的实现逻辑可能是下面这样:

  • 检查日志文件是否达到限制大小,如果达到则删除备份文件,否则继续写入日志文件。
  • 重命名日志文件为备份文件。

这显然不能完全满足需求。

字符串替换?

如果要在内存中完成循环覆写操作就比较简单了,使用字符串或Buffer的即可完成。

  • 添加字符串/Buffer长度,如果超过大小则截取。
  • 写入并覆盖日志文件。

但是有一个很大的问题:占用内存。

比如限制文件大小为1GB,有10个日志文件同时写入,那么至少占用10GB内存空间!

内存可是比磁盘空间更宝贵的,如此明显的性能问题,显然也不是最优解决方式。

file roll

按照需求可以把实现步骤拆成两步:

  • 追加最新的数据到文件末尾。(Node.js的fs模块有相应函数)
  • 删除文件开头超出限制部分。(Node.js没有响应函数)

这两步不分先后顺序,但是Node.js没有提供API来删除文件开头部分,只提供了修改文件指定位置的函数。

既然无法删除文件开头部分内容,那么我们就换个思路,只保留文件末尾部分内容(不超出大小限制)。

什么?这不是一个意思么?

略有区别~

删除是在原有文件上进行的操作,而保留内容可以借助临时文件来进行操作。

所以思路变成:

  1. 创建一个临时文件,临时文件的内容来自于日志文件。
  2. 往临时文件中增加数据。
  3. 将临时文件中符合文件大小限制的内容,从后往前(采取偏移量的形式)进行读取并复制到日志文件进行覆盖。
  4. 为了不占用额外的磁盘空间,写操作完成后删除临时文件。

这样就不会出现像log4js一样日志文件内容不全的现象,也不会保留额外的临时文件。但是对IO的操作会增加~
对于写操作可以采取tail命令来实现,最终实现代码如下:

private write(name: string, buf?: Buffer | string) {
 // append buf to tmp file
 const tmpName = name.replace(/(.*\/)(.*$)/, '$1_\.$2\.tmp');
 if (!existsSync(tmpName)) {
 copyFileSync(name, tmpName);
 }
 buf && appendFileSync(tmpName, buf);
 // if busy, wait
 if (this.stream && this.stream.readable) {
 this.needUpdateLogFile[name] = true;
 } else {
 try {
  execSync(`tail -c ${limit} ${tmpName} > ${name}`);
  try {
  if (this.needUpdateLogFile[name]) {
   this.needUpdateLogFile[name] = false;
   this.write(name);
  } else {
   existsSync(tmpName) && unlinkSync(tmpName);
  }
  } catch (e) {
  console.error(e);
  }
 } catch (e) {
  console.error(e);
 }
 }
}

总结

完成这个功能有两点感悟:

  1. 量变引起质变。当数据量变大时,很多简单的处理方式就不可以用了,比如写文件,如果直接使用writeFile会占用大量内存甚至有可能内存都不够用。所以要通过合适的方式进行拆分,拆分过程中又会碰到各种问题,比如本文中截取文件内容的要求。
  2. 学会借力。君子性非异也善假于物也~当无法在单个点完成操作的时候可以借助外部条件来实现,比如在本文中使用临时文件来保存数据内容。

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。

Javascript 相关文章推荐
javascript中关于break,continue的特殊用法与介绍
May 24 Javascript
js showModalDialog弹出窗口实例详解
Jan 07 Javascript
jQuery+Pdo编写login登陆界面
Aug 01 Javascript
JavaScript中const、var和let区别浅析
Oct 11 Javascript
React学习笔记之列表渲染示例详解
Aug 22 Javascript
Windows安装Node.js报错:2503、2502的解决方法
Oct 25 Javascript
JavaScript实现随机点名器实例详解
May 07 Javascript
layui对工具条进行选择性的显示方法
Sep 19 Javascript
原生JavaScript实现的无缝滚动功能详解
Jan 17 Javascript
JavaScript监听键盘事件代码实现
Jun 03 Javascript
jQuery 实现DOM元素拖拽交换位置的实例代码
Jul 14 jQuery
React Native项目框架搭建的一些心得体会
May 28 Javascript
详解JavaScript栈内存与堆内存
Apr 04 #Javascript
jQuery中实现text()的方法
Apr 04 #jQuery
基于 jQuery 实现键盘事件监听控件
Apr 04 #jQuery
详解微信图片防盗链“此图片来自微信公众平台 未经允许不得引用”的解决方案
Apr 04 #Javascript
基于Vue+elementUI实现动态表单的校验功能(根据条件动态切换校验格式)
Apr 04 #Javascript
vue学习笔记五:在vue项目里面使用引入公共方法详解
Apr 04 #Javascript
JavaScript多种页面刷新方法小结
Apr 04 #Javascript
You might like
PHP学习之PHP运算符
2006/10/09 PHP
php curl post 时出现的问题解决
2014/01/30 PHP
指定js可访问其它域名的cookie的方法
2007/09/18 Javascript
jquery 入门教程 [翻译] 推荐
2009/08/17 Javascript
学习并汇集javascript匿名函数
2010/11/25 Javascript
仅Firefox中链接A无法实现模拟点击以触发其默认行为
2011/07/31 Javascript
js 如何实现对数据库的增删改查
2012/11/23 Javascript
js 页面元素的几个用法总结
2013/11/18 Javascript
javascript生成随机大小写字母的方法
2014/02/20 Javascript
JavaScript中解析JSON数据的三种方法
2015/07/03 Javascript
javascript解析xml实现省市县三级联动的方法
2015/07/25 Javascript
JS获取时间的相关函数及时间戳与时间日期之间的转换
2016/02/04 Javascript
深入理解MVC中的时间js格式化
2016/05/19 Javascript
jQuery文字横向滚动效果的实现代码
2016/05/31 Javascript
AngularJS中watch监听用法分析
2016/11/04 Javascript
jQuery实现删除li节点的方法
2016/12/06 Javascript
canvas简单快速的实现知乎登录页背景效果
2017/05/08 Javascript
layer子层给父层页面元素赋值,以达到向父层页面传值的效果实例
2017/09/22 Javascript
jQuery实现简单的Ajax调用功能示例
2019/02/15 jQuery
使用VueCli3+TypeScript+Vuex一步步构建todoList的方法
2019/07/25 Javascript
python 获取一个值在某个区间的指定倍数的值方法
2018/11/12 Python
python+opencv实现霍夫变换检测直线
2020/10/23 Python
python读取图片任意范围区域
2019/01/23 Python
浅谈如何使用python抓取网页中的动态数据实现
2020/08/17 Python
css3 flex实现div内容水平垂直居中的几种方法
2020/03/27 HTML / CSS
信号量和自旋锁的区别?如何选择使用?
2015/09/08 面试题
超市后勤自我鉴定
2014/01/17 职场文书
会计学生自我鉴定
2014/02/06 职场文书
鸿星尔克广告词
2014/03/21 职场文书
贷款委托书怎么写
2014/08/02 职场文书
2014年群众路线教育实践活动整改措施
2014/09/24 职场文书
2014教师年度思想工作总结
2014/11/10 职场文书
成绩单家长意见
2015/06/03 职场文书
Python中OpenCV实现简单车牌字符切割
2021/06/11 Python
SpringCloud Function SpEL注入漏洞分析及环境搭建
2022/04/08 Java/Android
pytest实现多进程与多线程运行超好用的插件
2022/07/15 Python