使用Python脚本对Linux服务器进行监控的教程


Posted in Python onApril 02, 2015

目前 Linux 下有一些使用 Python 语言编写的 Linux 系统监控工具 比如 inotify-sync(文件系统安全监控软件)、glances(资源监控工具)在实际工作中,Linux 系统管理员可以根据自己使用的服务器的具体情况编写一下简单实用的脚本实现对 Linux 服务器的监控。 本文介绍一下使用 Python 脚本实现对 Linux 服务器 CPU 内存 网络的监控脚本的编写。
Python 版本说明

Python 是由 Guido van Rossum 开发的、可免费获得的、非常高级的解释型语言。其语法简单易懂,而其面向对象的语义功能强大(但又灵活)。Python 可以广泛使用并具有高度的可移植性。本文 Linux 服务器是 Ubuntu 12.10, Python 版本 是 2.7 。如果是 Python 3.0 版本的语法上有一定的出入。另外这里笔者所说的 Python 是 CPython,CPython 是用 C 语言实现的 Python 解释器,也是官方的并且是最广泛使用的Python 解释器。除了 CPython 以外,还有用 Java 实现的 Jython 和用.NET 实现的 IronPython,使 Python方便地和 Java 程序、.NET 程序集成。另外还有一些实验性的 Python 解释器比如 PyPy。CPython 是使用字节码的解释器,任何程序源代码在执行之前先要编译成字节码。它还有和几种其它语言(包括 C 语言)交互的外部函数接口。
工作原理:基于/proc 文件系统

Linux 系统为管理员提供了非常好的方法,使其可以在系统运行时更改内核,而不需要重新引导内核系统,这是通过/proc 虚拟文件系统实现的。/proc 文件虚拟系统是一种内核和内核模块用来向进程(process)发送信息的机制(所以叫做“/proc”),这个伪文件系统允许与内核内部数据结构交互,获取有关进程的有用信息,在运行中(on the fly)改变设置(通过改变内核参数)。与其他文件系统不同,/proc 存在于内存而不是硬盘中。proc 文件系统提供的信息如下:

  •     进程信息:系统中的任何一个进程,在 proc 的子目录中都有一个同名的进程 ID,可以找到 cmdline、mem、root、stat、statm,以及 status。某些信息只有超级用户可见,例如进程根目录。每一个单独含有现有进程信息的进程有一些可用的专门链接,系统中的任何一个进程都有一个单独的自链接指向进程信息,其用处就是从进程中获取命令行信息。
  •     系统信息:如果需要了解整个系统信息中也可以从/proc/stat 中获得,其中包括 CPU 占用情况、磁盘空间、内存对换、中断等。
  •     CPU 信息:利用/proc/CPUinfo 文件可以获得中央处理器的当前准确信息。
  •     负载信息:/proc/loadavg 文件包含系统负载信息。
  •     系统内存信息:/proc/meminfo 文件包含系统内存的详细信息,其中显示物理内存的数量、可用交换空间的数量,以及空闲内存的数量等。

表 1 是 /proc 目录中的主要文件的说明:
表 1 /proc 目录中的主要文件的说明

使用Python脚本对Linux服务器进行监控的教程

下面本文的几个例子都是使用 Python 脚本读取/proc 目录中的主要文件来实现实现对 Linux 服务器的监控的 。
使用 Python 脚本实现对 Linux 服务器的监控
对于 CPU(中央处理器)监测

脚本 1 名称 CPU1.py,作用获取 CPU 的信息。
清单 1.获取 CPU 的信息

#!/usr/bin/env Python
from __future__ import print_function
from collections import OrderedDict
import pprint
 
def CPUinfo():
  ''' Return the information in /proc/CPUinfo
  as a dictionary in the following format:
  CPU_info['proc0']={...}
  CPU_info['proc1']={...}
  '''
  CPUinfo=OrderedDict()
  procinfo=OrderedDict()
 
  nprocs = 0
  with open('/proc/CPUinfo') as f:
    for line in f:
      if not line.strip():
        # end of one processor
        CPUinfo['proc%s' % nprocs] = procinfo
        nprocs=nprocs+1
        # Reset
        procinfo=OrderedDict()
      else:
        if len(line.split(':')) == 2:
          procinfo[line.split(':')[0].strip()] = line.split(':')[1].strip()
        else:
          procinfo[line.split(':')[0].strip()] = ''
 
  return CPUinfo
 
if __name__=='__main__':
  CPUinfo = CPUinfo()
  for processor in CPUinfo.keys():
    print(CPUinfo[processor]['model name'])

简单说明一下清单 1,读取/proc/CPUinfo 中的信息,返回 list,每核心一个 dict。其中 list 是一个使用方括号括起来的有序元素集合。List 可以作为以 0 下标开始的数组。Dict 是 Python 的内置数据类型之一, 它定义了键和值之间一对一的关系。OrderedDict 是一个字典子类,可以记住其内容增加的顺序。常规 dict 并不跟踪插入顺序,迭代处理时会根据键在散列表中存储的顺序来生成值。在 OrderedDict 中则相反,它会记住元素插入的顺序,并在创建迭代器时使用这个顺序。

可以使用 Python 命令运行脚本 CPU1.py 结果见图 1
 
# Python CPU1.py
Intel(R) Celeron(R) CPU E3200  @ 2.40GHz
图 1.运行清单 1

使用Python脚本对Linux服务器进行监控的教程

也可以使用 chmod 命令添加权限收直接运行 CPU1.py
 
#chmod +x CPU1.py
# ./CPU1.py
对于系统负载监测

脚本 2 名称 CPU2.py,作用获取系统的负载信息
清单 2 获取系统的负载信息
 

#!/usr/bin/env Python 
import os
def load_stat():
  loadavg = {}
  f = open("/proc/loadavg")
  con = f.read().split()
  f.close()
  loadavg['lavg_1']=con[0]
  loadavg['lavg_5']=con[1]
  loadavg['lavg_15']=con[2]
  loadavg['nr']=con[3]
  loadavg['last_pid']=con[4]
  return loadavg
print "loadavg",load_stat()['lavg_15']

简单说明一下清单 2:清单 2 读取/proc/loadavg 中的信息,import os :Python 中 import 用于导入不同的模块,包括系统提供和自定义的模块。其基本形式为:import 模块名 [as 别名],如果只需要导入模块中的部分或全部内容可以用形式:from 模块名 import *来导入相应的模块。OS 模块 os 模块提供了一个统一的操作系统接口函数,os 模块能在不同操作系统平台如 nt,posix 中的特定函数间自动切换,从而实现跨平台操作。

可以使用 Python 命令运行脚本 CPU1.py 结果见图 2 # Python CPU2.py
图 2.运行清单 2

使用Python脚本对Linux服务器进行监控的教程

对于内存信息的获取

脚本 3 名称 mem.py,作用是获取内存使用情况信息
清单 3 获取内存使用情况
 

#!/usr/bin/env Python
 
from __future__ import print_function
from collections import OrderedDict
 
def meminfo():
  ''' Return the information in /proc/meminfo
  as a dictionary '''
  meminfo=OrderedDict()
 
  with open('/proc/meminfo') as f:
    for line in f:
      meminfo[line.split(':')[0]] = line.split(':')[1].strip()
  return meminfo
 
if __name__=='__main__':
  #print(meminfo())
 
  meminfo = meminfo()
  print('Total memory: {0}'.format(meminfo['MemTotal']))
  print('Free memory: {0}'.format(meminfo['MemFree']))

简单说明一下清单 3:清单 3 读取 proc/meminfo 中的信息,Python 字符串的 split 方法是用的频率还是比较多的。比如我们需要存储一个很长的数据,并且按照有结构的方法存储,方便以后取数据进行处理。当然可以用 json 的形式。但是也可以把数据存储到一个字段里面,然后有某种标示符来分割。 Python 中的 strip 用于去除字符串的首位字符,最后清单 3 打印出内存总数和空闲数。

可以使用 Python 命令运行脚本 mem.py 结果见图 3。 # Python mem.py
图 3.运行清单 3

使用Python脚本对Linux服务器进行监控的教程

对于网络接口的监测

脚本 4 名称是 net.py,作用获取网络接口的使用情况。
清单 4 net.py 获取网络接口的输入和输出

#!/usr/bin/env Python
import time
import sys
 
if len(sys.argv) > 1:
  INTERFACE = sys.argv[1]
else:
  INTERFACE = 'eth0'
STATS = []
print 'Interface:',INTERFACE
 
def rx():
  ifstat = open('/proc/net/dev').readlines()
  for interface in ifstat:
    if INTERFACE in interface:
      stat = float(interface.split()[1])
      STATS[0:] = [stat]
 
def tx():
  ifstat = open('/proc/net/dev').readlines()
  for interface in ifstat:
    if INTERFACE in interface:
      stat = float(interface.split()[9])
      STATS[1:] = [stat]
 
print  'In     Out'
rx()
tx()
 
while  True:
  time.sleep(1)
  rxstat_o = list(STATS)
  rx()
  tx()
  RX = float(STATS[0])
  RX_O = rxstat_o[0]
  TX = float(STATS[1])
  TX_O = rxstat_o[1]
  RX_RATE = round((RX - RX_O)/1024/1024,3)
  TX_RATE = round((TX - TX_O)/1024/1024,3)
  print RX_RATE ,'MB   ',TX_RATE ,'MB'

简单说明一下清单 4:清单 4 读取/proc/net/dev 中的信息,Python 中文件操作可以通过 open 函数,这的确很像 C 语言中的 fopen。通过 open 函数获取一个 file object,然后调用 read(),write()等方法对文件进行读写操作。另外 Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: read()、readline() 和 readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。然而 .read() 生成文件内容最直接的字符串表示,但对于连续的面向行的处理,它却是不必要的,并且如果文件大于可用内存,则不可能实现这种处理。.readline() 和 .readlines() 之间的差异是后者一次读取整个文件,象 .read() 一样。.readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for … in … 结构进行处理。另一方面,.readline() 每次只读取一行,通常比 .readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用 .readline()。最后清单 4 打印出网络接口的输入和输出情况。

可以使用 Python 命令运行脚本 net.py 结果见图 4 #Python net.py
图 4.运行清单 4

使用Python脚本对Linux服务器进行监控的教程

监控 Apache 服务器进程的 Python 脚本

Apache 服务器进程可能会因为系统各种原因而出现异常退出,导致 Web 服务暂停。所以笔者写一个 Python 脚本文件:
清单 5 crtrl.py 监控 Apache 服务器进程的 Python 脚本
 

#!/usr/bin/env Python
import os, sys, time
 
while True:
time.sleep(4)
try:
ret = os.popen('ps -C apache -o pid,cmd').readlines()
if len(ret) < 2:
print "apache 进程异常退出, 4 秒后重新启动"
time.sleep(3)
os.system("service apache2 restart")
except:
print "Error", sys.exc_info()[1]

设置文件权限为执行属性(使用命令 chmod +x crtrl.py),然后加入到/etc/rc.local 即可,一旦 Apache 服务器进程异常退出,该脚本自动检查并且重启。 简单说明一下清单 5 这个脚本不是基于/proc 伪文件系统的,是基于 Python 自己提供的一些模块来实现的 。这里使用的是 Python 的内嵌 time 模板,time 模块提供各种操作时间的函数。
总结

在实际工作中,Linux 系统管理员可以根据自己使用的服务器的具体情况编写一下简单实用的脚本实现对 Linux 服务器的监控。本文介绍一下使用 Python 脚本实现对 Linux 服务器 CPU 、系统负载、内存和 网络使用情况的监控脚本的编写方法。

Python 相关文章推荐
Python中使用item()方法遍历字典的例子
Aug 26 Python
Python优先队列实现方法示例
Sep 21 Python
Python 实现淘宝秒杀的示例代码
Jan 02 Python
浅谈flask截获所有访问及before/after_request修饰器
Jan 18 Python
Pycharm之快速定位到某行快捷键的方法
Jan 20 Python
在Pytorch中使用样本权重(sample_weight)的正确方法
Aug 17 Python
检测tensorflow是否使用gpu进行计算的方式
Feb 03 Python
Python while循环使用else语句代码实例
Feb 07 Python
Python基础教程之输入输出和运算符
Jul 26 Python
python使用布隆过滤器的实现示例
Aug 20 Python
python基于scrapy爬取京东笔记本电脑数据并进行简单处理和分析
Apr 14 Python
利用Pycharm连接服务器的全过程记录
Jul 01 Python
在Python编程过程中用单元测试法调试代码的介绍
Apr 02 #Python
用Python的Django框架完成视频处理任务的教程
Apr 02 #Python
用map函数来完成Python并行任务的简单示例
Apr 02 #Python
对于Python异常处理慎用“except:pass”建议
Apr 02 #Python
Python的设计模式编程入门指南
Apr 02 #Python
介绍Python中的一些高级编程技巧
Apr 02 #Python
用Python代码来解图片迷宫的方法整理
Apr 02 #Python
You might like
PHP中开发XML应用程序之基础篇 添加节点 删除节点 查询节点 查询节
2010/07/09 PHP
.htaccess文件保护实例讲解
2011/02/06 PHP
PHP 万年历实现代码
2012/10/18 PHP
PHP各种异常和错误的拦截方法及发生致命错误时进行报警
2016/01/19 PHP
PHP错误处理函数register_shutdown_function使用示例
2017/07/03 PHP
javascript间隔定时器(延时定时器)学习 间隔调用和延时调用
2014/01/13 Javascript
JavaScript中实现Map的示例代码
2015/09/09 Javascript
JavaScript职责链模式概述
2016/09/17 Javascript
JS实现的RGB网页颜色在线取色器完整实例
2016/12/21 Javascript
基于JavaScript定位当前的地理位置
2017/04/11 Javascript
深入理解Vue生命周期、手动挂载及挂载子组件
2017/09/27 Javascript
webpack打包js文件及部署的实现方法
2017/12/18 Javascript
10 种最常见的 Javascript 错误(频率最高)
2018/02/08 Javascript
vue使用jsonp抓取qq音乐数据的方法
2018/06/21 Javascript
使用webpack打包后的vue项目如何正确运行(express)
2018/10/26 Javascript
微信小程序实现Session功能及无法获取session问题的解决方法
2019/05/07 Javascript
IE浏览器下JS脚本提交表单后,不能自动提示问题解决方法
2019/06/04 Javascript
node.js中stream流中可读流和可写流的实现与使用方法实例分析
2020/02/13 Javascript
微信小程序实现左滑删除效果
2020/11/18 Javascript
[48:47]VGJ.S vs NB 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
对于Python的框架中一些会话程序的管理
2015/04/20 Python
python Opencv将图片转为字符画
2021/02/19 Python
python 利用jinja2模板生成html代码实例
2019/10/10 Python
Python数据存储之 h5py详解
2019/12/26 Python
django 获取字段最大值,最新的记录操作
2020/08/09 Python
如何利用python读取micaps文件详解
2020/10/18 Python
css3中less实现文字长阴影(long shadow)
2020/04/24 HTML / CSS
水芝澳美国官网:H2O Plus
2016/10/15 全球购物
比利时买床:Beter Bed
2017/12/06 全球购物
如何找出EMP表里面SALARY第N高的employee
2013/12/05 面试题
施工安全协议书
2013/12/11 职场文书
合作意向协议书范本
2014/03/31 职场文书
男女朋友协议书
2014/04/23 职场文书
党的群众路线教育实践活动对照检查材料思想汇报
2014/09/19 职场文书
小学生2014国庆节演讲稿:祖国在我心中
2014/09/21 职场文书
webpack介绍使用配置教程详解webpack介绍和使用
2022/06/25 Javascript