微信告警的zabbix监控系统 监控整个NGINX集群


Posted in Servers onApril 18, 2022

项目描述

本项目的目的是构建一个能实现微信告警的zabbix监控系统,方便的监控整个NGINX集群,同时能批量的去部署和管理整个集群。

项目步骤

  • zabbix服务端(192.168.2.138)安装好zabbix server,nginx端安装好zabbix agent(192.168.2.58),配置好Nginx负载均衡集群,并打开状态统计。
  • nginx端编写监控脚本,取到nginx的状态。
  • 服务端web添加监控项,出图。
  • 注册企业微信,配置好微信接口。
  • zabbix服务端添加接口推送脚本,测试接口正常。
  • 在web端配置报警媒介,群组和用户,添加相关触发器和动作。
  • nginx关停服务,测试是否能通过微信告警。

项目心得

在测试接收消息过程中,返回值一直是参数{ALTER.MESSAGE},排查脚本问题,版本问题,最后发现是参数{ALERT.MESSAGE},所以打字一定要细心,认真。同时对监控也有了一定的认识,运维人员不可能7*24小时盯着zabbix看,所以做到及时告警是非常必要的,对之前的高可用web集群项目叶可以进行完善。

详细步骤

zabbix-agent客户端nginx配置监控

nginx打开状态统计功能

nginx配置增加stub_status模块

location = /wyt_status{
stub_status;}

测试状态统计功能是否打开

http://192.168.2.58/wyt_status\

nginx端(zabbix客户端)编写监控脚本

cd /etc/zabbix/zabbix_agentd.d 
#在zabbix_agentd.d目录下编写监控脚本
vim zabbix-nginx_status.sh
#!/bin/bash
case $1 in
        active)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null|awk '/Active/ {print $NF}'
                ;;
        accepts)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null|awk 'NR==3 {print $1}'
                ;;
        handled)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==3 {print $2}'
                ;;
        requests)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==3 {print $3}'
                ;;
        reading)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $2}'
                ;;
        writing)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $4}'
                ;;
        waiting)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $NF}'
                ;;
           ping)
                pidof nginx |wc -l
                #通过查询进程PID值,测试nginx存活状态
                ;;
esac
vim userparameter_nginx.conf
#在zabbix_agentd.d目录下自定义参数配置文件
UserParameter=nginx.status[*],/etc/zabbix/zabbix_agentd.d/zabbix-nginx_status.sh $1
#指定动作
chmod +x zabbix-nginx_status.sh
#授予可执行权限
service zabbix-agent restart
#刷新服务
zabbix_get -k nginx.status[ping] -s 192.168.2.58
#去服务端测试是否返回参数1

zabbix-server-web配置监控

先创建nginx主机master-nginx

微信告警的zabbix监控系统 监控整个NGINX集群

添加应用集nginx

微信告警的zabbix监控系统 监控整个NGINX集群

在应用集nginx增加监控项

微信告警的zabbix监控系统 监控整个NGINX集群

自定义触发器nginx-up-down,监控项为nginx-ping,正常为1,每5s监控一次,若为0,严重警告。

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

除nginx-ping,nginx-accepts外,需要添加所有状态监控项,只有nginx-ping创建触发器,这里不一一举例。

微信告警的zabbix监控系统 监控整个NGINX集群

添加好所有监控项,下一步制图,图中包含所有监控项

微信告警的zabbix监控系统 监控整个NGINX集群

因为我们监控实际上就是在一直请求,所以看到nginx-requests在不断增加。

微信告警的zabbix监控系统 监控整个NGINX集群

注册企业微信接口

注册成功之后创建一个运维部门

微信告警的zabbix监控系统 监控整个NGINX集群

记住自己的企业ID

微信告警的zabbix监控系统 监控整个NGINX集群

自建应用

微信告警的zabbix监控系统 监控整个NGINX集群

应用名称为zabbix监控

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

创建成功后,查看信息记住自己的AgentId和Secret

微信告警的zabbix监控系统 监控整个NGINX集群

微信扫码企业微信插件就可以在微信接收消息

微信告警的zabbix监控系统 监控整个NGINX集群

zabbix-server接口脚本配置告警

Shell脚本

cd /usr/lib/zabbix/alertscripts
进入脚本配置文件夹
vim weixin.sh
#!/bin/bash

CorpID="wwaa6fb8ff1b81aa77"     # 你的企业id
Secret="Cxyd*****"    #你的SecretID
GURL="https://qyapi.weixin.qq.com/cgi-bin/gettoken?corpid=$CorpID&corpsecret=$Secret"
Token=$(/usr/bin/curl -s -G $GURL |awk -F\": '{print $4}'|awk -F\" '{print $2}')
# echo $Token
PURL="https://qyapi.weixin.qq.com/cgi-bin/message/send?access_token=$Token"

function body(){
        local int agentid=1000002               # 你的agentdid
        local UserID="@all"                 # 发送的用户ID
        local PartyID=1                  # 部门ID
        local Msg=$(echo "$@" | cut -d" " -f3-) # 发送给所有人
        printf '{\n'
        printf '\t"touser": "'"$UserID"\"",\n"
        printf '\t"toparty": "'"$PartyID"\"",\n"
        printf '\t"msgtype": "text",\n'
        printf '\t"agentid": "'"$agentid"\"",\n"
        printf '\t"text": {\n'
        printf '\t\t"content": "'"$Msg"\""\n"
        printf '\t},\n'
        printf '\t"safe":"0"\n'
        printf '}\n'
}
/usr/bin/curl --data-ascii "$(body $1 $2 $3)" $PURL

测试脚本能否正常接收消息

微信告警的zabbix监控系统 监控整个NGINX集群

可以看到正常接收。

微信告警的zabbix监控系统 监控整个NGINX集群

然后我们回到zabbix-server-web配置

zabbix-server-web配置告警

管理->报警媒介类型->创建媒体类型

微信告警的zabbix监控系统 监控整个NGINX集群

创建用户群组

微信告警的zabbix监控系统 监控整个NGINX集群

创建用户

微信告警的zabbix监控系统 监控整个NGINX集群

报警媒介

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

权限->超级管理员

微信告警的zabbix监控系统 监控整个NGINX集群

配置->动作

添加触发器

微信告警的zabbix监控系统 监控整个NGINX集群

操作

故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生{TRIGGER.NAME}故障!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

微信告警的zabbix监控系统 监控整个NGINX集群

恢复操作

恢复{TRIGGER.STATUS}, 服务器:{HOSTNAME1}: {TRIGGER.NAME}已恢复!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

微信告警的zabbix监控系统 监控整个NGINX集群

zabbix-agent关停nginx服务测试

微信告警的zabbix监控系统 监控整个NGINX集群


可以看到推送成功

微信告警的zabbix监控系统 监控整个NGINX集群

Python webhook机器人脚本

新建一个测试群聊,在群里添加机器人,记住webhook地址

微信告警的zabbix监控系统 监控整个NGINX集群

除了使用Shell脚本配置接口之外,还可以使用Python脚本

#!/usr/bin/python
#-*- coding: utf-8 -*-
import requests
import json
import sys
import os

headers = {'Content-Type': 'application/json;charset=utf-8'}
api_url = "https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=****”
#填写自己的webhook地址
def msg(text):
    json_text= {
     "msgtype": "text",
        "text": {
            "content": text
        },
    }
    print requests.post(api_url,json.dumps(json_text),headers=headers).content

if __name__ == '__main__':
    text = sys.argv[1]
    msg(text)

测试

python weixin.py test

web配置同上

微信告警的zabbix监控系统 监控整个NGINX集群

总结 

到此这篇关于Zabbix自定义脚本监控nginx以及微信告警的文章就介绍到这了!

Servers 相关文章推荐
nginx 设置多个站跨域
Mar 09 Servers
nginx对http请求处理的各个阶段详析
Mar 31 Servers
详解Nginx 工作原理
Mar 31 Servers
扩展多台相同的Web服务器
Apr 01 Servers
nginx配置文件使用环境变量的操作方法
Jun 02 Servers
Nginx的基本概念和原理
Mar 21 Servers
Kubernetes控制节点的部署
Apr 01 Servers
教你使用Jenkins集成Harbor自动发布镜像
Apr 03 Servers
nginx配置之并发频次限制
Apr 18 Servers
Windows Server 2016 配置 IIS 的详细步骤
Apr 28 Servers
解决Windows Server2012 R2 无法安装 .NET Framework 3.5
Apr 29 Servers
彻底卸载VMware虚拟机的超详细步骤记录
Jul 15 Servers
nginx配置之并发频次限制
如何通过cmd 连接阿里云服务器
Linux中如何安装并部署Redis
Apr 18 #Servers
nginx搭建NFS网络文件系统
Mac电脑OS系统下安装Nginx的详细教程
Docker 镜像介绍以及commit相关操作
Docker官方工具docker-registry案例演示
Apr 13 #Servers
You might like
PHP出错界面
2006/10/09 PHP
php 获取mysql数据库信息代码
2009/03/12 PHP
PHP中“简单工厂模式”实例代码讲解
2012/09/04 PHP
浅谈Yii乐观锁的使用及原理
2017/07/25 PHP
JavaScript 继承的实现
2009/07/09 Javascript
JQuery实现的在新窗口打开链接的方法小结
2010/04/22 Javascript
Javascript中的apply()方法浅析
2015/03/15 Javascript
js点击文本框后才加载验证码实例代码
2015/10/20 Javascript
JavaScript常用基础知识强化学习
2015/12/09 Javascript
Jquery插件easyUi实现表单验证示例
2015/12/15 Javascript
node模块机制与异步处理详解
2016/03/13 Javascript
Bootstrap登陆注册页面开发教程
2016/07/12 Javascript
微信小程序中单位rpx和rem的使用
2016/12/06 Javascript
如何实现一个webpack模块解析器
2018/10/24 Javascript
微信小程序如何获取群聊的openGid以及名称详解
2019/07/17 Javascript
Python程序设计入门(3)数组的使用
2014/06/16 Python
从零开始学Python第八周:详解网络编程基础(socket)
2016/12/14 Python
使用python语言,比较两个字符串是否相同的实例
2018/06/29 Python
使用Python获取网段IP个数以及地址清单的方法
2018/11/01 Python
Python3实现的回文数判断及罗马数字转整数算法示例
2019/03/27 Python
OpenCV 边缘检测
2019/07/10 Python
python 中的[:-1]和[::-1]的具体使用
2020/02/13 Python
python如何求100以内的素数
2020/05/27 Python
澳大利亚小众服装品牌:Maurie & Eve
2018/03/27 全球购物
Andrew Marc官网:设计师外套的领先制造商
2019/10/30 全球购物
SQL SERVER面试资料
2013/03/30 面试题
主键(Primary Key)约束和唯一性(UNIQUE)约束的区别
2013/05/29 面试题
电子商务网站的创业计划书
2014/01/05 职场文书
抽样调查项目计划书
2014/04/24 职场文书
弘扬雷锋精神演讲稿
2014/05/10 职场文书
任命书范本大全
2014/06/06 职场文书
教师党员自我剖析材料
2014/09/29 职场文书
节约用电通知
2015/04/25 职场文书
MySQL中distinct与group by之间的性能进行比较
2021/05/26 MySQL
浅谈MySQL函数
2021/10/05 MySQL
MySql数据库 查询时间序列间隔
2022/05/11 MySQL