服务器 NodeJs

NodeJS读取分析Nginx错误日志的方法

Posted in NodeJs onMay 14, 2019

网上很少看到有用NodeJS运维系列文章,后续我会更新一些NodeJS运维相关的内容又或者说让我们更加的深入了解一些服务器的知识以及自动化运维方面的基础知识为什么要做错误日志分析,因为网上这方面的工具不多我找到一个goaccess但是都是分析成功日志以及用户访问趋势,找了半天没找着自己想要的索性就自己利用Node造一个

错误日志分析

首先我们要读取Nginx日志,我们可以看到Nginx的错误日志格式一般都是这样子,需要注意的是Nginx的错误日志格式是差不多的因为无法设置日志格式只能设置日志错误等级所以我们分析的时候很方便

这里我们用到readline

逐行读取,简单来说可以做

文件逐行读取：比如说进行日志分析。
自动完成：比如输入npm，自动提示"help init install"。
命令行工具：比如npm init这种问答式的脚手架工具。这里我们主要做日志分析其他的感兴趣可以琢磨一下

实现方法

const readline = require('readline');
const fs = require('fs');
const path = require('path');
console.time('readline-time')
const rl = readline.createInterface({
 input: fs.createReadStream(path.join(__dirname, '../public/api.err.log'), {
  start: 0,
  end: Infinity
 }),

});
let count = 0; 
rl.on('line', (line) => {
 const arr = line.split(', ');
 const time = arr[0].split('*')[0].split('[')[0].replace(/\//g, '-');//获取到时间
 const error = arr[0].split('*')[1].split(/\d\s/)[1];//错误原因
 const client = arr[1].split(' ')[1];//请求的客户端
 const server = arr[2].split(' ')[1];//请求的网址
 const url = arr[3].match(/\s\/(\S*)\s/)[0].trim()//获取请求链接
 const upstream = arr[4].match(/(?<=").*?(?=")/g)[0];//获取上游
 const host = arr[5].match(/(?<=").*?(?=")/g)[0];//获取host
 const referrer = arr[6] ? arr[6].match(/(?<=").*?(?=")/g)[0] : '';//来源
 console.log(`时间:${time}-原因:${error}-客户端:${client}-网址:${server}-地址:${url}-上游:${upstream}-主机:${host}-来源:${referrer}`); 
 count++;
});
rl.on('close', () => {
 let size = fs.statSync(path.join(__dirname, '../public/api.err.log')).size;
 console.log(`读取完毕:${count};文件位置:${size % 2 === 0}`);
 console.timeEnd('readline-time')
});

上面代码有几点需要注意的是会创建一个文件可读流然后由于演示所以我是直接找的本地地址如果是生产环境的话大家可以直接填写服务器上的错误日志地址,如果没有Nginx错误日志分割的话每天会产生很多日志,createReadStream读取几十M的文件还好如果读取几百M或者上G的容量日志这会造成性能问题,所以我们需要在每次createReadStream没必要每次从0字节开始读取,ceateReadStream提供了start和end

NodeJS读取分析Nginx错误日志的方法

所以我们每次可以在读取完之后记录一下当前文件字节大小下一次读取文件就是可以用该文件上次的大小开始读取

let size = fs.statSync(path.join(__dirname, '../public/api.err.log')).size;

我们可以对比一下每次从0字节开始读取和从指定字节读取

NodeJS读取分析Nginx错误日志的方法

保存数据进行分析

这里我是用node-schedule这个库进行定时保存错误日志和linux的cron差不多,用的mongodb保存数据,这里更推荐大家用elasticsearch来做日志分析

rl.on('close', async () => {
     let count = 0;
     for (let i of rlist) {
      count++;
      if (count % 500 === 0) {
       const res = await global.db.collection('logs').bulkWrite(rlist.slice(count, count + 500), { ordered: false, w: 1 }).catch(err => { console.error(`批量插入出错${err}`) }); 
      } else if (count === rlist.length - 1) {
      //批量插入 数据
       const res = await global.db.collection('logs').bulkWrite(rlist.slice(rlist - (rlist % 500), rlist.length), { ordered: false, w: 1 });
       let size = fs.statSync(addres).size;
       size = size % 2 === 0 ? size : size + 1;//保证字节大小是偶数 不然会出现读取上行内容不完整的情况
       count = 0;
       rlist.length = [];
       //更新数据库里面文件的size
       global.db.collection('tasks').updateOne({ _id: addre }, { $set: { _id: addre, size, date: +new Date() } }, { upsert: true }); 
      }
     }
     resolve(true);
    })

上面主要是500条保存一次,因为我用的是批量插入然后mongodb有限制一次性最多插入16M数据的限制,所以大家看自己清空决定一次性插入多少条犹豫对readline的实现比较感兴趣,就去翻阅了一下源码发现并不是我们想的那么复杂, readline源码 ,下面贴一下line事件的源码,想继续深入的同学可以看看全部的源码

if (typeof s === 'string' && s) {
     var lines = s.split(/\r\n|\n|\r/);
     for (var i = 0, len = lines.length; i < len; i++) {
      if (i > 0) {
       this._line();
      }
      this._insertString(lines[i]);
     }
    }
...
Interface.prototype._line = function() {
 const line = this._addHistory();
 this.clearLine();
 this._onLine(line);
};
...
Interface.prototype._onLine = function(line) {
 if (this._questionCallback) {
  var cb = this._questionCallback;
  this._questionCallback = null;
  this.setPrompt(this._oldPrompt);
  cb(line);
 } else {
  this.emit('line', line);
 }
};

保存的数据需要进行分析比如哪个IP访问最多哪条错误最多可以用聚合来进行分析贴出示例分析某个IP在某一天访问出错最多的原因

db.logs.aggregate(
 // Pipeline
 [
 // Stage 1
 {
  $group: {
   '_id': { 'client': '114.112.163.28', 'server': '$server', 'error': '$error', 'url': '$url', 'upstream': '$upstream','date':'$date' ,'msg':'$msg' } ,
     
   'date':{'$addToSet':'$date'},
   count: { '$sum': 1 } 
  }
 },
 // Stage 2
 {
  $match: { 
     count: { $gte: 1 },
     date: ['2019-05-10']
    
  }
 },
 {
  $sort: {
    count: -1
  }
 },
 ],
 // Options
 {
 cursor: {
  batchSize: 50
 },
 allowDiskUse: true
 }
);

总结

以上所述是小编给大家介绍的NodeJS读取分析Nginx错误日志的方法，希望对大家有所帮助，如果大家有任何疑问欢迎给我留言，小编会及时回复大家的！

NodeJS读取分析Nginx错误日志的方法

- Author -

zpzxgcr

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

NodeJs 相关文章推荐

nodejs入门详解(多篇文章结合)

Mar 07 NodeJs

轻松创建nodejs服务器（5）：事件处理程序

Dec 18 NodeJs

轻松创建nodejs服务器（8）：非阻塞是如何实现的

Dec 18 NodeJs

nodejs 整合kindEditor实现图片上传

Feb 03 NodeJs

Highcharts＋NodeJS搭建数据可视化平台示例

Jan 01 NodeJs

windows 下安装nodejs 环境变量设置

Feb 02 NodeJs

NodeJs下的测试框架Mocha的简单介绍

Feb 22 NodeJs

详解nodejs微信公众号开发——1.接入微信公众号

Apr 10 NodeJs

win系统下nodejs环境安装配置

May 04 NodeJs

NodeJS实现视频转码的示例代码

Nov 18 NodeJs

通过nodejs 服务器读取HTML文件渲染到页面的方法

May 17 NodeJs

使用nodeJS中的fs模块对文件及目录进行读写,删除,追加,等操作详解

Feb 06 NodeJs

nodejs搭建本地服务器并访问文件操作示例

May 11 #NodeJs

M2实现Nodejs项目自动部署的方法步骤

May 05 #NodeJs

nodejs通过钉钉群机器人推送消息的实现代码

May 05 #NodeJs

nodejs中request库使用HTTPS代理的方法

Apr 30 #NodeJs

详解微信小程序-获取用户session_key,openid,unionid - 后端为nodejs

Apr 29 #NodeJs

nodejs检测因特网是否断开的解决方案

Apr 17 #NodeJs

Nodejs实现用户注册功能

Apr 14 #NodeJs

You might like

PHP取进制余数函数代码

2012/01/19 PHP

php5.5中类级别的常量使用介绍

2013/10/02 PHP

ThinkPHP之M方法实例详解

2014/06/20 PHP

基于PHP实现的多元线性回归模拟曲线算法

2018/01/30 PHP

jquery 弹出层实现代码

2009/10/30 Javascript

判断用户是否在线的代码

2011/03/05 Javascript

Jquery动态改变图片IMG的src地址示例

2013/06/25 Javascript

对于this和$(this)的个人理解

2013/09/08 Javascript

详解JavaScript的while循环的使用

2015/06/03 Javascript

解决JS请求服务器gbk文件乱码的问题

2015/10/16 Javascript

原生Javascript插件开发实践

2017/01/09 Javascript

Angular2搜索和重置按钮过场动画

2017/05/24 Javascript

vue利用axios来完成数据的交互

2018/03/23 Javascript

详解组件库的webpack构建速度优化

2018/06/18 Javascript

jQuery轻量级表单模型验证插件

2018/10/15 jQuery

一文了解Vue中的nextTick

2019/05/06 Javascript

Node.js API详解之 querystring用法实例分析

2020/04/29 Javascript

[02:56]DOTA2亚洲邀请赛 VG出场战队巡礼

2015/02/07 DOTA

[43:57]Liquid vs Mineski 2019国际邀请赛小组赛 BO2 第二场 8.16

2019/08/19 DOTA

flask中使用蓝图将路由分开写在不同文件实例解析

2018/01/19 Python

利用numpy和pandas处理csv文件中的时间方法

2018/04/19 Python

利用python的socket发送http(s)请求方法示例

2018/05/07 Python

Python get获取页面cookie代码实例

2018/09/12 Python

Python实现12306火车票抢票系统

2019/07/04 Python

keras小技巧——获取某一个网络层的输出方式

2020/05/23 Python

美国新蛋IT数码商城：Newegg.com

2016/07/21 全球购物

DBA的职责都有哪些

2012/05/16 面试题

Linux如何命名文件--使用文件名时应注意

2014/05/29 面试题

运动会入场词60字

2014/02/15 职场文书

生日主持词

2014/03/20 职场文书

《回乡偶书》教学反思

2014/04/12 职场文书

职业规划实施方案

2014/06/10 职场文书

单位委托书怎么写

2014/09/21 职场文书

假期安全教育广播稿

2014/10/04 职场文书

高一英语教学反思

2016/03/03 职场文书

Golang ort 中的sortInts 方法

2022/04/24 Golang