微信告警的zabbix监控系统 监控整个NGINX集群


Posted in Servers onApril 18, 2022

项目描述

本项目的目的是构建一个能实现微信告警的zabbix监控系统,方便的监控整个NGINX集群,同时能批量的去部署和管理整个集群。

项目步骤

  • zabbix服务端(192.168.2.138)安装好zabbix server,nginx端安装好zabbix agent(192.168.2.58),配置好Nginx负载均衡集群,并打开状态统计。
  • nginx端编写监控脚本,取到nginx的状态。
  • 服务端web添加监控项,出图。
  • 注册企业微信,配置好微信接口。
  • zabbix服务端添加接口推送脚本,测试接口正常。
  • 在web端配置报警媒介,群组和用户,添加相关触发器和动作。
  • nginx关停服务,测试是否能通过微信告警。

项目心得

在测试接收消息过程中,返回值一直是参数{ALTER.MESSAGE},排查脚本问题,版本问题,最后发现是参数{ALERT.MESSAGE},所以打字一定要细心,认真。同时对监控也有了一定的认识,运维人员不可能7*24小时盯着zabbix看,所以做到及时告警是非常必要的,对之前的高可用web集群项目叶可以进行完善。

详细步骤

zabbix-agent客户端nginx配置监控

nginx打开状态统计功能

nginx配置增加stub_status模块

location = /wyt_status{
stub_status;}

测试状态统计功能是否打开

http://192.168.2.58/wyt_status\

nginx端(zabbix客户端)编写监控脚本

cd /etc/zabbix/zabbix_agentd.d 
#在zabbix_agentd.d目录下编写监控脚本
vim zabbix-nginx_status.sh
#!/bin/bash
case $1 in
        active)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null|awk '/Active/ {print $NF}'
                ;;
        accepts)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null|awk 'NR==3 {print $1}'
                ;;
        handled)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==3 {print $2}'
                ;;
        requests)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==3 {print $3}'
                ;;
        reading)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $2}'
                ;;
        writing)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $4}'
                ;;
        waiting)
                curl http://192.168.2.58:80/wyt_status 2>/dev/null |awk 'NR==4 {print $NF}'
                ;;
           ping)
                pidof nginx |wc -l
                #通过查询进程PID值,测试nginx存活状态
                ;;
esac
vim userparameter_nginx.conf
#在zabbix_agentd.d目录下自定义参数配置文件
UserParameter=nginx.status[*],/etc/zabbix/zabbix_agentd.d/zabbix-nginx_status.sh $1
#指定动作
chmod +x zabbix-nginx_status.sh
#授予可执行权限
service zabbix-agent restart
#刷新服务
zabbix_get -k nginx.status[ping] -s 192.168.2.58
#去服务端测试是否返回参数1

zabbix-server-web配置监控

先创建nginx主机master-nginx

微信告警的zabbix监控系统 监控整个NGINX集群

添加应用集nginx

微信告警的zabbix监控系统 监控整个NGINX集群

在应用集nginx增加监控项

微信告警的zabbix监控系统 监控整个NGINX集群

自定义触发器nginx-up-down,监控项为nginx-ping,正常为1,每5s监控一次,若为0,严重警告。

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

除nginx-ping,nginx-accepts外,需要添加所有状态监控项,只有nginx-ping创建触发器,这里不一一举例。

微信告警的zabbix监控系统 监控整个NGINX集群

添加好所有监控项,下一步制图,图中包含所有监控项

微信告警的zabbix监控系统 监控整个NGINX集群

因为我们监控实际上就是在一直请求,所以看到nginx-requests在不断增加。

微信告警的zabbix监控系统 监控整个NGINX集群

注册企业微信接口

注册成功之后创建一个运维部门

微信告警的zabbix监控系统 监控整个NGINX集群

记住自己的企业ID

微信告警的zabbix监控系统 监控整个NGINX集群

自建应用

微信告警的zabbix监控系统 监控整个NGINX集群

应用名称为zabbix监控

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

创建成功后,查看信息记住自己的AgentId和Secret

微信告警的zabbix监控系统 监控整个NGINX集群

微信扫码企业微信插件就可以在微信接收消息

微信告警的zabbix监控系统 监控整个NGINX集群

zabbix-server接口脚本配置告警

Shell脚本

cd /usr/lib/zabbix/alertscripts
进入脚本配置文件夹
vim weixin.sh
#!/bin/bash

CorpID="wwaa6fb8ff1b81aa77"     # 你的企业id
Secret="Cxyd*****"    #你的SecretID
GURL="https://qyapi.weixin.qq.com/cgi-bin/gettoken?corpid=$CorpID&corpsecret=$Secret"
Token=$(/usr/bin/curl -s -G $GURL |awk -F\": '{print $4}'|awk -F\" '{print $2}')
# echo $Token
PURL="https://qyapi.weixin.qq.com/cgi-bin/message/send?access_token=$Token"

function body(){
        local int agentid=1000002               # 你的agentdid
        local UserID="@all"                 # 发送的用户ID
        local PartyID=1                  # 部门ID
        local Msg=$(echo "$@" | cut -d" " -f3-) # 发送给所有人
        printf '{\n'
        printf '\t"touser": "'"$UserID"\"",\n"
        printf '\t"toparty": "'"$PartyID"\"",\n"
        printf '\t"msgtype": "text",\n'
        printf '\t"agentid": "'"$agentid"\"",\n"
        printf '\t"text": {\n'
        printf '\t\t"content": "'"$Msg"\""\n"
        printf '\t},\n'
        printf '\t"safe":"0"\n'
        printf '}\n'
}
/usr/bin/curl --data-ascii "$(body $1 $2 $3)" $PURL

测试脚本能否正常接收消息

微信告警的zabbix监控系统 监控整个NGINX集群

可以看到正常接收。

微信告警的zabbix监控系统 监控整个NGINX集群

然后我们回到zabbix-server-web配置

zabbix-server-web配置告警

管理->报警媒介类型->创建媒体类型

微信告警的zabbix监控系统 监控整个NGINX集群

创建用户群组

微信告警的zabbix监控系统 监控整个NGINX集群

创建用户

微信告警的zabbix监控系统 监控整个NGINX集群

报警媒介

微信告警的zabbix监控系统 监控整个NGINX集群

微信告警的zabbix监控系统 监控整个NGINX集群

权限->超级管理员

微信告警的zabbix监控系统 监控整个NGINX集群

配置->动作

添加触发器

微信告警的zabbix监控系统 监控整个NGINX集群

操作

故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生{TRIGGER.NAME}故障!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

微信告警的zabbix监控系统 监控整个NGINX集群

恢复操作

恢复{TRIGGER.STATUS}, 服务器:{HOSTNAME1}: {TRIGGER.NAME}已恢复!
告警主机:{HOSTNAME1}
告警时间:{EVENT.DATE} {EVENT.TIME}
告警等级:{TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目:{TRIGGER.KEY1}
问题详情:{ITEM.NAME}:{ITEM.VALUE}
当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID:{EVENT.ID}

微信告警的zabbix监控系统 监控整个NGINX集群

zabbix-agent关停nginx服务测试

微信告警的zabbix监控系统 监控整个NGINX集群


可以看到推送成功

微信告警的zabbix监控系统 监控整个NGINX集群

Python webhook机器人脚本

新建一个测试群聊,在群里添加机器人,记住webhook地址

微信告警的zabbix监控系统 监控整个NGINX集群

除了使用Shell脚本配置接口之外,还可以使用Python脚本

#!/usr/bin/python
#-*- coding: utf-8 -*-
import requests
import json
import sys
import os

headers = {'Content-Type': 'application/json;charset=utf-8'}
api_url = "https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=****”
#填写自己的webhook地址
def msg(text):
    json_text= {
     "msgtype": "text",
        "text": {
            "content": text
        },
    }
    print requests.post(api_url,json.dumps(json_text),headers=headers).content

if __name__ == '__main__':
    text = sys.argv[1]
    msg(text)

测试

python weixin.py test

web配置同上

微信告警的zabbix监控系统 监控整个NGINX集群

总结 

到此这篇关于Zabbix自定义脚本监控nginx以及微信告警的文章就介绍到这了!

Servers 相关文章推荐
nginx 设置多个站跨域
Mar 09 Servers
Nginx优化服务之网页压缩的实现方法
Mar 31 Servers
Nginx中break与last的区别详析
Mar 31 Servers
Nginx解决前端访问资源跨域问题的方法详解
Mar 31 Servers
使用 Apache Superset 可视化 ClickHouse 数据的两种方法
Jul 07 Servers
nginx中封禁ip和允许内网ip访问的实现示例
Mar 17 Servers
Nginx静态压缩和代码压缩提高访问速度详解
May 30 Servers
openEuler 搭建java开发环境的详细过程
Jun 10 Servers
nginx之queue的具体使用
Jun 28 Servers
Windows7下FTP搭建图文教程
Aug 05 Servers
WIN10使用IIS部署ftp服务器详细教程
Aug 05 Servers
windows10 家庭版下FTP服务器搭建教程
Aug 05 Servers
nginx配置之并发频次限制
如何通过cmd 连接阿里云服务器
Linux中如何安装并部署Redis
Apr 18 #Servers
nginx搭建NFS网络文件系统
Mac电脑OS系统下安装Nginx的详细教程
Docker 镜像介绍以及commit相关操作
Docker官方工具docker-registry案例演示
Apr 13 #Servers
You might like
phpmyadmin导入(import)文件限制的解决办法
2009/12/11 PHP
PHP pathinfo()获得文件的路径、名称等信息说明
2011/09/13 PHP
PHP获取Exif缩略图的方法
2015/07/13 PHP
表单提交错误后返回内容消失问题的解决方法(PHP网站)
2015/10/20 PHP
浅谈htmlentities 、htmlspecialchars、addslashes的使用方法
2016/12/09 PHP
使用PHP连接数据库_实现用户数据的增删改查的整体操作示例
2017/09/01 PHP
php中通用的excel导出方法实例
2017/12/30 PHP
thinkphp框架无限级栏目的排序功能实现方法示例
2020/03/29 PHP
PHP使用POP3读取邮箱接收邮件的示例代码
2020/07/08 PHP
php如何实现数据库的备份和恢复
2020/11/30 PHP
javascript编程起步(第四课)
2007/02/27 Javascript
浅谈javascript 面向对象编程
2009/10/28 Javascript
浅析webapp框架AngularUI的demo
2014/12/21 Javascript
PHP 数组current和next用法分享
2015/03/05 Javascript
跟我学习javascript解决异步编程异常方案
2015/11/23 Javascript
JavaScript必知必会(七)js对象继承
2016/06/08 Javascript
jquery radio的取值_radio的选中_radio的重置方法
2016/09/20 Javascript
JS表单数据验证的正则表达式(常用)
2017/02/18 Javascript
为你的微信小程序体积瘦身详解
2017/05/20 Javascript
js操作二进制数据方法
2018/03/03 Javascript
vue项目打包部署到服务器的方法示例
2018/08/27 Javascript
使用JavaScript破解web
2018/09/28 Javascript
JS实现数组删除指定元素功能示例
2019/06/05 Javascript
如何手写一个简易的 Vuex
2020/10/10 Javascript
Python基础之getpass模块详细介绍
2017/08/10 Python
安装python3的时候就是输入python3死活没有反应的解决方法
2018/01/24 Python
Python爬虫实战之12306抢票开源
2019/01/24 Python
pthon贪吃蛇游戏详细代码
2019/01/27 Python
Python 使用 attrs 和 cattrs 实现面向对象编程的实践
2019/06/12 Python
Python中的__init__作用是什么
2020/06/09 Python
canvas实现手机的手势解锁的步骤详细
2020/03/16 HTML / CSS
会计实习期自我鉴定
2013/10/06 职场文书
法学院毕业生求职信
2014/06/25 职场文书
Springboot集成阿里云OSS上传文件系统教程
2021/06/28 Java/Android
windows11怎么查看自己安装的版本号? win11版本号的查看方法
2021/11/21 数码科技
多线程Spring通过@Scheduled实现定时任务
2022/05/25 Java/Android