微信告警的zabbix监控系统 监控整个NGINX集群


Posted in Servers onApril 18, 2022

项目描述

本项目的目的是构建一个能实现微信告警的zabbix监控系统,方便的监控整个NGINX集群,同时能批量的去部署和管理整个集群。

项目步骤

  • zabbix服务端(192.168.2.138)安装好zabbix server,nginx端安装好zabbix agent(192.168.2.58),配置好Nginx负载均衡集群,并打开状态统计。
  • nginx端编写监控脚本,取到nginx的状态。
  • 服务端web添加监控项,出图。
  • 注册企业微信,配置好微信接口。
  • zabbix服务端添加接口推送脚本,测试接口正常。
  • 在web端配置报警媒介,群组和用户,添加相关触发器和动作。
  • nginx关停服务,测试是否能通过微信告警。

项目心得

在测试接收消息过程中,返回值一直是参数{ALTER.MESSAGE},排查脚本问题,版本问题,最后发现是参数{ALERT.MESSAGE},所以打字一定要细心,认真。同时对监控也有了一定的认识,运维人员不可能7*24小时盯着zabbix看,所以做到及时告警是非常必要的,对之前的高可用web集群项目叶可以进行完善。

详细步骤

zabbix-agent客户端nginx配置监控

nginx打开状态统计功能

nginx配置增加stub_status模块

location = /wyt_status{
stub_status;}

测试状态统计功能是否打开

http://192.168.2.58/wyt_status\

nginx端(zabbix客户端)编写监控脚本

cd /etc/zabbix/zabbix_agentd.d 
#在zabbix_agentd.d目录下编写监控脚本
vim zabbix-nginx_status.sh
#!/bin/bash
case $1 in
        active)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null|awk '/Active/ {print $NF}'
                ;;
        accepts)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null|awk 'NR==3 {print $1}'
                ;;
        handled)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==3 {print $2}'
                ;;
        requests)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==3 {print $3}'
                ;;
        reading)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $2}'
                ;;
        writing)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $4}'
                ;;
        waiting)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $NF}'
                ;;
           ping)
                pidof nginx |wc -l
                #通过查询进程PID值,测试nginx存活状态
                ;;
esac
vim userparameter_nginx.conf
#在zabbix_agentd.d目录下自定义参数配置文件
UserParameter=nginx.status[*],/etc/zabbix/zabbix_agentd.d/zabbix-nginx_status.sh $1
#指定动作
chmod +x zabbix-nginx_status.sh
#授予可执行权限
service zabbix-agent restart
#刷新服务
zabbix_get -k nginx.status[ping] -s 192.168.2.58
#去服务端测试是否返回参数1

zabbix-server-web配置监控

先创建nginx主机master-nginx

微信告警的zabbix监控系统 监控整个NGINX集群

添加应用集nginx

微信告警的zabbix监控系统 监控整个NGINX集群

在应用集nginx增加监控项

微信告警的zabbix监控系统 监控整个NGINX集群

自定义触发器nginx-up-down,监控项为nginx-ping,正常为1,每5s监控一次,若为0,严重警告。

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

除nginx-ping,nginx-accepts外,需要添加所有状态监控项,只有nginx-ping创建触发器,这里不一一举例。

微信告警的zabbix监控系统 监控整个NGINX集群

添加好所有监控项,下一步制图,图中包含所有监控项

微信告警的zabbix监控系统 监控整个NGINX集群

因为我们监控实际上就是在一直请求,所以看到nginx-requests在不断增加。

微信告警的zabbix监控系统 监控整个NGINX集群

注册企业微信接口

注册成功之后创建一个运维部门

微信告警的zabbix监控系统 监控整个NGINX集群

记住自己的企业ID

微信告警的zabbix监控系统 监控整个NGINX集群

自建应用

微信告警的zabbix监控系统 监控整个NGINX集群

应用名称为zabbix监控

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

创建成功后,查看信息记住自己的AgentId和Secret

微信告警的zabbix监控系统 监控整个NGINX集群

微信扫码企业微信插件就可以在微信接收消息

微信告警的zabbix监控系统 监控整个NGINX集群

zabbix-server接口脚本配置告警

Shell脚本

cd /usr/lib/zabbix/alertscripts
进入脚本配置文件夹
vim weixin.sh
#!/bin/bash

CorpID="wwaa6fb8ff1b81aa77"     # 你的企业id
Secret="Cxyd*****"    #你的SecretID
GURL="https://qyapi.weixin.qq.com/cgi-bin/gettoken?corpid=$CorpID&corpsecret=$Secret"
Token=$(/usr/bin/curl -s -G $GURL |awk -F\": '{print $4}'|awk -F\" '{print $2}')
# echo $Token
PURL="https://qyapi.weixin.qq.com/cgi-bin/message/send?access_token=$Token"

function body(){
        local int agentid=1000002               # 你的agentdid
        local UserID="@all"                 # 发送的用户ID
        local PartyID=1                  # 部门ID
        local Msg=$(echo "$@" | cut -d" " -f3-) # 发送给所有人
        printf '{\n'
        printf '\t"touser": "'"$UserID"\"",\n"
        printf '\t"toparty": "'"$PartyID"\"",\n"
        printf '\t"msgtype": "text",\n'
        printf '\t"agentid": "'"$agentid"\"",\n"
        printf '\t"text": {\n'
        printf '\t\t"content": "'"$Msg"\""\n"
        printf '\t},\n'
        printf '\t"safe":"0"\n'
        printf '}\n'
}
/usr/bin/curl --data-ascii "$(body $1 $2 $3)" $PURL

测试脚本能否正常接收消息

微信告警的zabbix监控系统 监控整个NGINX集群

可以看到正常接收。

微信告警的zabbix监控系统 监控整个NGINX集群

然后我们回到zabbix-server-web配置

zabbix-server-web配置告警

管理->报警媒介类型->创建媒体类型

微信告警的zabbix监控系统 监控整个NGINX集群

创建用户群组

微信告警的zabbix监控系统 监控整个NGINX集群

创建用户

微信告警的zabbix监控系统 监控整个NGINX集群

报警媒介

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

权限->超级管理员

微信告警的zabbix监控系统 监控整个NGINX集群

配置->动作

添加触发器

微信告警的zabbix监控系统 监控整个NGINX集群

操作

故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生{TRIGGER.NAME}故障!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

微信告警的zabbix监控系统 监控整个NGINX集群

恢复操作

恢复{TRIGGER.STATUS}, 服务器:{HOSTNAME1}: {TRIGGER.NAME}已恢复!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

微信告警的zabbix监控系统 监控整个NGINX集群

zabbix-agent关停nginx服务测试

微信告警的zabbix监控系统 监控整个NGINX集群


可以看到推送成功

微信告警的zabbix监控系统 监控整个NGINX集群

Python webhook机器人脚本

新建一个测试群聊,在群里添加机器人,记住webhook地址

微信告警的zabbix监控系统 监控整个NGINX集群

除了使用Shell脚本配置接口之外,还可以使用Python脚本

#!/usr/bin/python
#-*- coding: utf-8 -*-
import requests
import json
import sys
import os

headers = {'Content-Type': 'application/json;charset=utf-8'}
api_url = "https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=****”
#填写自己的webhook地址
def msg(text):
    json_text= {
     "msgtype": "text",
        "text": {
            "content": text
        },
    }
    print requests.post(api_url,json.dumps(json_text),headers=headers).content

if __name__ == '__main__':
    text = sys.argv[1]
    msg(text)

测试

python weixin.py test

web配置同上

微信告警的zabbix监控系统 监控整个NGINX集群

总结 

到此这篇关于Zabbix自定义脚本监控nginx以及微信告警的文章就介绍到这了!

Servers 相关文章推荐
nginx 设置多个站跨域
Mar 09 Servers
Nginx中break与last的区别详析
Mar 31 Servers
Nginx已编译的nginx-添加新模块
Apr 01 Servers
nginx刷新页面出现404解决方案(亲测有效)
Mar 18 Servers
docker-compose部署Yapi的方法
Apr 08 Servers
nginx.conf配置文件结构小结
Apr 08 Servers
CentOS安装Nginx并部署vue
Apr 12 Servers
Windows Server 2019 配置远程控制以及管理方法
Apr 28 Servers
使用 DataAnt 监控 Apache APISIX的原理解析
Jul 07 Servers
nginx代理实现静态资源访问的示例代码
Jul 07 Servers
Nginx使用ngx_http_upstream_module实现负载均衡功能示例
Aug 05 Servers
ubuntu20.04虚拟机无法上网的问题及解决
Dec 24 Servers
nginx配置之并发频次限制
如何通过cmd 连接阿里云服务器
Linux中如何安装并部署Redis
Apr 18 #Servers
nginx搭建NFS网络文件系统
Mac电脑OS系统下安装Nginx的详细教程
Docker 镜像介绍以及commit相关操作
Docker官方工具docker-registry案例演示
Apr 13 #Servers
You might like
PHP 多维数组排序(usort,uasort)
2010/06/30 PHP
PHP中COOKIES使用示例
2015/07/26 PHP
AJAX PHP无刷新form表单提交的简单实现(推荐)
2016/09/09 PHP
PHP手机号中间四位用星号*代替显示的实例
2017/06/02 PHP
PHPStudy下如何为Apache安装SSL证书的方法步骤
2019/01/23 PHP
详解PHP PDO简单教程
2019/05/28 PHP
yii 框架实现按天,月,年,自定义时间段统计数据的方法分析
2020/04/04 PHP
QQ登录简单实现代码
2021/03/09 Javascript
雄兵连第三季海报曝光,艾妮熙德成主角,蔷薇新造型
2021/03/09 国漫
Jquery replace 字符替换实现代码
2010/12/02 Javascript
Javascript延迟执行实现方法(setTimeout)
2010/12/30 Javascript
JS判定是否原生方法
2013/07/22 Javascript
关于js内存泄露的一个好例子
2013/12/09 Javascript
node.js中RPC(远程过程调用)的实现原理介绍
2014/12/05 Javascript
JavaScript获取表格(table)当前行的值、删除行、增加行
2015/07/03 Javascript
小议JavaScript中Generator和Iterator的使用
2015/07/29 Javascript
Extjs 点击复选框在表格中增加相关信息行
2016/07/12 Javascript
谈谈对JavaScript原生拖放的深入理解
2016/09/20 Javascript
JavaScript中数组的各种操作的总结(必看篇)
2017/02/13 Javascript
Vue.js实现在下拉列表区域外点击即可关闭下拉列表的功能(自定义下拉列表)
2017/05/30 Javascript
vue使用axios跨域请求数据问题详解
2017/10/18 Javascript
Vue.js在数组中插入重复数据的实现代码
2017/11/17 Javascript
三步搞定:Vue.js调用Android原生操作
2020/09/07 Javascript
vue全局使用axios的操作
2020/09/08 Javascript
详解Django框架中用户的登录和退出的实现
2015/07/23 Python
python获取网页中所有图片并筛选指定分辨率的方法
2018/03/31 Python
Python3.5 Pandas模块之DataFrame用法实例分析
2019/04/23 Python
树莓派使用USB摄像头和motion实现监控
2019/06/22 Python
twilio python自动拨打电话,播放自定义mp3音频的方法
2019/08/08 Python
详解Python+Selenium+ChromeDriver的配置和问题解决
2021/01/19 Python
canvas 阴影和图形变换的示例代码
2018/01/02 HTML / CSS
机电专业体育教师求职信
2013/09/21 职场文书
新郎新娘婚礼答谢词
2014/01/11 职场文书
新郎父亲婚宴答谢词
2014/01/11 职场文书
合作协议书模板2014
2014/09/26 职场文书
教师党员自我评价2015
2015/03/04 职场文书