使用Python的Supervisor进行进程监控以及自动启动


Posted in Python onMay 29, 2014

做服务器端开发的同学应该都对进程监控不会陌生,最近恰好要更换 uwsgi 为 gunicorn,而gunicorn又恰好有这么一章讲进程监控,所以多研究了下。

结合之前在腾讯工作的经验,也会讲讲腾讯的服务器监控是怎么做的。同时也会讲下小团队又该怎么敏捷的解决。

下面按照监控的方法依次介绍。

一、按照进程名监控

在腾讯内部所有server都是要打包发布的,而在打包过程中是需要填写要监控的进程名,然后在crontab中定时通过ps查询进程是否存在。

这种方法是比较简单的方法,但是考虑到很多进程会在启动之后改名,以及进程名存在各种特殊字符,多个进程同时存在的问题,实际操作起来并不是很舒服。

举个简单的例子,gunicorn启动之后的进程名类似这样 master: [wsgi:app],其中的方括号在grep时要记得转义,否则就会出问题。

不过不管怎么说,这种方法在很多其他方式用不了的时候反而是最简单的方法。

下面是用python的实现:

def monitor_process(key_word, cmd):
    p1 = subprocess.Popen(['ps', '-ef'], stdout=subprocess.PIPE)
    p2 = subprocess.Popen(['grep', key_word], stdin=p1.stdout, stdout=subprocess.PIPE)
    p3 = subprocess.Popen(['grep', '-v', 'grep'], stdin=p2.stdout, stdout=subprocess.PIPE)
    lines = p3.stdout.readlines()
    if len(lines) > 0:
        return
    sys.stderr.write('process[%s] is lost, run [%s]\n' % (key_word, cmd))
    subprocess.call(cmd, shell=True)

二、按照端口监控

这种方式之前在腾讯打包的时候也有用,但是可能是进程名更直观的原因吧,貌似一直没怎么用起来。

不过现在自己在做包部署的时候,反而觉得端口监控是个最靠谱的事情了。这个也没什么好多说的,直接上刚写完的python代码:

def monitor_port(protocol, port, cmd):
    address = ('127.0.0.1', port)
    socket_type = socket.SOCK_STREAM if protocol == 'tcp' else socket.SOCK_DGRAM
    client = socket.socket(socket.AF_INET, socket_type)
    try:
        client.bind(address)
    except Exception, e:
        pass
    else:
        sys.stderr.write('port[%s-%s] is lost, run [%s]\n' % (protocol, port, cmd))
        subprocess.call(cmd, shell=True)
    finally:
        client.close()

有的朋友可能说对于tcp端口检查,其实以client的方式来connect()看是否成功会不会更好?其实我觉得这种方式也挺好的,并且对于不同的协议可以再深入处理一下,比如对http协议可以用urllib2.urlopen确保返回正确的包才算正常。不过如果这么做的话,就有点偏黑盒监控 了,比如监控宝、阿里云监控之类的服务了。

三、通过监控server启动进程,并以监控子进程的方式监控

这个也是在gunicorn页面上看到的,说起来gunicorn很不厚道的把gaffer放到第一个,让我还以为是个很成熟的产品,结果发现连启动都是个问题。

相反排在后面的supervisor反而相当的好用,下面是截图:

使用Python的Supervisor进行进程监控以及自动启动

supervisor可以很方便的管理进程,包括重启,停止等等,而且提供了web界面和用户验证,可以很方便的在线管理。

但是有好处就有坏处,用了supervisor之后,就不能自己随便的去自己重启服务了,否则会影响supervisor的监控,这对我这种喜欢自己执行 xx.sh restart 的人实在有点太痛苦了。当然,其实要是习惯了去supervisorctl 里面start/stop/reload 之后也就还好了。

用supervisor配置gunicorn的配置项如下:

[program:yuanzhaopin]
environment=PYTHON_EGG_CACHE=/tmp/.python-eggs/,PYTHONPATH=/data/release/yuanzhaopin
command=/usr/local/bin/gunicorn --debug --log-level debug --log-file /tmp/g.log wsgi:app
user=zny2008
autorestart=true
redirect_stderr=true

ok,目前自己常用的就是这几种模式了,大家如果有其他选择欢迎留言讨论。

完整代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
#*/1 * * * * python /xxx/monitor.py >> /xxx/logs/monitor.log 2>&1  &
import sys
import subprocess
import os.path as op
import socket
def this_abs_path(script_name):
    return op.abspath(op.join(op.dirname(__file__), script_name))

def monitor_process(key_word, cmd):
    p1 = subprocess.Popen(['ps', '-ef'], stdout=subprocess.PIPE)
    p2 = subprocess.Popen(['grep', key_word], stdin=p1.stdout, stdout=subprocess.PIPE)
    p3 = subprocess.Popen(['grep', '-v', 'grep'], stdin=p2.stdout, stdout=subprocess.PIPE)
    lines = p3.stdout.readlines()
    if len(lines) > 0:
        return
    sys.stderr.write('process[%s] is lost, run [%s]\n' % (key_word, cmd))
    subprocess.call(cmd, shell=True)

def monitor_port(protocol, port, cmd):
    address = ('127.0.0.1', port)
    socket_type = socket.SOCK_STREAM if protocol == 'tcp' else socket.SOCK_DGRAM
    client = socket.socket(socket.AF_INET, socket_type)
    try:
        client.bind(address)
    except Exception, e:
        pass
    else:
        sys.stderr.write('port[%s-%s] is lost, run [%s]\n' % (protocol, port, cmd))
        subprocess.call(cmd, shell=True)
    finally:
        client.close()

#=============================================================================
def yuanzhaopin():
    cmd = '%s start' % this_abs_path('gun.sh')
    #monitor_process('\[yuanzhaopin\]', cmd)
    monitor_port('tcp', 8635, cmd)

def main():
    yuanzhaopin()

if __name__ == '__main__':
    main()
Python 相关文章推荐
python实现爬虫下载美女图片
Jul 14 Python
使用Nginx+uWsgi实现Python的Django框架站点动静分离
Mar 21 Python
编写Python爬虫抓取暴走漫画上gif图片的实例分享
Apr 20 Python
一些Centos Python 生产环境的部署命令(推荐)
May 07 Python
python dataframe常见操作方法:实现取行、列、切片、统计特征值
Jun 09 Python
python之django母板页面的使用
Jul 03 Python
Python实现微信小程序支付功能
Jul 25 Python
Pycharm+Python工程,引用子模块的实现
Mar 09 Python
Python简单实现词云图代码及步骤解析
Jun 04 Python
Python基础教程(一)——Windows搭建开发Python开发环境
Jul 20 Python
学会迭代器设计模式,帮你大幅提升python性能
Jan 03 Python
详解Python魔法方法之描述符类
May 26 Python
python应用程序在windows下不出现cmd窗口的办法
May 29 #Python
python正则表达式re模块详细介绍
May 29 #Python
在python中的socket模块使用代理实例
May 29 #Python
python中stdout输出不缓存的设置方法
May 29 #Python
python两种遍历字典(dict)的方法比较
May 29 #Python
python中常用的各种数据库操作模块和连接实例
May 29 #Python
从零学Python之入门(五)缩进和选择
May 27 #Python
You might like
php正则表达式基本知识与应用详解【经典教程】
2017/04/17 PHP
Laravel框架路由和控制器的绑定操作方法
2018/06/12 PHP
Jquery Autocomplete 结合asp.net使用要点
2010/10/29 Javascript
整理Javascript函数学习笔记
2015/12/01 Javascript
jQuery使用$.ajax提交表单完整实例
2015/12/11 Javascript
AngularJs bootstrap详解及示例代码
2016/09/01 Javascript
js+css3制作时钟特效
2016/10/16 Javascript
Bootstrap源码解读网格系统(3)
2016/12/22 Javascript
JavaScript之DOM插入更新删除_动力节点Java学院整理
2017/07/03 Javascript
angular $watch 一个变量的变化(实例讲解)
2017/08/02 Javascript
微信小程序实现登录注册tab切换效果
2020/12/29 Javascript
关于layui 实现点击按钮添加一行(方法渲染创建的table)
2019/09/29 Javascript
React实现类似淘宝tab居中切换效果的示例代码
2020/06/02 Javascript
vue element 关闭当前tab 跳转到上一路由操作
2020/07/22 Javascript
Vue解决移动端弹窗滚动穿透问题
2020/12/15 Vue.js
[29:23]2014 DOTA2国际邀请赛中国区预选赛 LGD-GAMING VS CIS 第一场1
2014/05/23 DOTA
Python中unittest用法实例
2014/09/25 Python
python使用clear方法清除字典内全部数据实例
2015/07/11 Python
Python自动化开发学习之三级菜单制作
2017/07/14 Python
Python实现屏幕截图的两种方式
2018/02/05 Python
Python中pymysql 模块的使用详解
2019/08/12 Python
centos+nginx+uwsgi+Django实现IP+port访问服务器
2019/11/15 Python
python隐藏类中属性的3种实现方法
2019/12/19 Python
CSS3 倾斜的网页图片库实例教程
2009/11/14 HTML / CSS
阿迪达斯印度官方商城:adidas India
2017/03/26 全球购物
英国版MAC彩妆品牌:Illamasqua
2018/04/18 全球购物
会话Bean的种类
2013/11/07 面试题
简单介绍Object类的功能、常用方法
2013/10/02 面试题
最新的咖啡店创业计划书
2013/12/30 职场文书
三八红旗集体先进事迹材料
2014/05/22 职场文书
2014年大学生预备党员思想汇报1000字
2014/09/13 职场文书
2015年组织委员工作总结
2015/04/23 职场文书
集结号观后感
2015/06/08 职场文书
如何做好员工培训计划?
2019/07/09 职场文书
MySQL事务操作的四大特性以及并发事务问题
2022/04/12 MySQL
Ubuntu18.04下QT开发Android无法连接设备问题解决实现
2022/06/01 Java/Android