python脚本结合zabbix 监控mongodb

一:因业务场景不同,部分业务需要使用mongodb,特写了如下几个python 小脚本配合zabbix 进行监控并根据不同的触发条件进行短信报警,具体如下:

1.1:监控mongodb的faults和locked值,调用python 脚本的时候通过传递变量判断第一个变量如果是faults就执行faults对应的函数,如果第一个参数是locked就执行locked对应的函数,并传递第二个参数为库的名称,然后执行不同的操作并返回不同的值:

1.1.1:脚本内容:

<code>#!/bin/env  python
#coding:utf-8

import subprocess
import sys
def mongodb_faults_num():
obj = subprocess.Popen(("/usr/local/mongodb/bin/mongostat -u user -p pswd--authenticationDatabase admin -rowcount 10 2 | tail -n10 \\
| awk '{print $11}' | tail -n10"),shell=True, stdout=subprocess.PIPE)
restful = obj.stdout.read()
data = restful.split()
print max(data) #取出统计结果中最大的一个值传递给zabbix

def mongodb_locked_num(dbname):
obj = subprocess.Popen(("/usr/local/mongodb/bin/mongostat -u user-p pswd --authenticationDatabase admin -rowcount 10 2 | tail -n10 \\
| grep %s | awk '{print $12}' | awk -F':' '{print $2}' | awk -F'%%' '{print $1}'" % dbname),shell=True, stdout=subprocess.PIPE)
restful = obj.stdout.read()
data = restful.split()
print max(data) #取出统计结果中最大的一个值传递给zabbix

def main():
if sys.argv[1] == "faults":
mongodb_faults_num()
elif sys.argv[1] == "locked": #如果第一个参数是locket
dbname=sys.argv[2] #将第二个参数赋值给dbname
mongodb_locked_num(dbname) #执行函数mongodb_locked_num并传递参数dbname
else:
pass
if __name__ == "__main__":
main()/<code>

1.1.2:将脚本添加到配置文件并重启zabbix_agentd服务:


<code>UserParameter=mongodb_faults_locked[*],/usr/bin/python /apps/zabbix_agent/etc/zabbix_agentd.conf.d/mongodb_faults_locked.py "$1" "$2"/<code>


1.1.3:此脚本里面有两个10秒执行的函数,但zabbix 默认超时时间为3秒,因此需要更改zabbix agent与zabbix server的配置文件并重启服务,如果执行已经更改为30秒就不用再更改了,注最大30秒:

<code>[root@saltstack-master ~]# salt "*"  cmd.run  "sed -i 's/^\\# Timeout=3/Timeout=30/g' /apps/zabbix_agent/etc/zabbix_agentd.conf"
[root@saltstack-master ~]# salt "*" cmd.run "service zabbix_agentd restart" #通过saltstack批量更改所以zabbix客户的配置文件并重启zabbix_agentd服务
[root@zabbix-server ~]# sed -i 's/^\\# Timeout=3/Timeout=30/g'   /usr/local/zabbix/etc/zabbix_server.conf
[root@zabbix-server ~]# /etc/init.d/zabbix_server  restart #更改zabbix_server配置文件并重启zabbix_Server服务/<code>

1.1.4:在mongodb模板里面添加faults的监控项:

python脚本结合zabbix 监控mongodb

1.1.5:在mongodb模板里面添加locket的监控项:

python脚本结合zabbix 监控mongodb

1.1.6:模板添加触发器:

python脚本结合zabbix 监控mongodb

1.1.7:模板添加图形:

python脚本结合zabbix 监控mongodb

1.1.8:监控结果:

python脚本结合zabbix 监控mongodb

1.2:监控mongodbDB复制集状态:

1.2.1:python脚本内容,主要是取出来各mongodb服务器的health值然后附加到两个列表,然后判断值为0的列表长度是否大于0或者判断health值为1的列表长度是否小于服务器的数量,假如所有mongodb节点的health值都正常就输出50,如果有任何一个不为1就输出100,内容如下:

<code>#!/bin/env  python
#coding:utf-8


import subprocess
success_list = []
error_list= []

def get_mongodb_status():
obj = subprocess.Popen(("echo 'rs.status()' | /usr/local/mongodb/bin/mongo -u user -p wswd --authenticationDatabase admin \\
| grep health | awk -F':' '{print $2}' | awk -F',' '{print $1}'"),shell=True, stdout=subprocess.PIPE)
restful = obj.stdout.read()
data = restful.split()
for i in data:
if i == "1":
success_list.append(i)
else:
error_list.append(i)

def count_status():
if len(error_list) > 0:
print 100
else:
print 50

def main():
get_mongodb_status()
count_status()

if __name__ == "__main__":
main()/<code>

1.2.2:将脚本添加到配置文件并重启zabbix_agentd服务:


<code>UserParameter=mongodb_cluster_check[*],/usr/bin/python /apps/zabbix_agent/etc/zabbix_agentd.conf.d/mongodb_cluster_monitor.py/<code>

1.2.3:模板添加监控项:


python脚本结合zabbix 监控mongodb

1.2.4:复制集触发器:

python脚本结合zabbix 监控mongodb

1.2.5:复制集图形:

python脚本结合zabbix 监控mongodb

1.2.6:最终的监控图形:

python脚本结合zabbix 监控mongodb

1.3:监控mongodb当前连接数:

1.3.1:脚本内容:


<code>#!/bin/env  python
#coding:utf-8

import subprocess

def mongodb_user_connections():
obj = subprocess.Popen(("echo 'db.serverStatus()' | /usr/local/mongodb/bin/mongo -u user -p pswd --authenticationDatabase admin | grep current | head -n1 | awk -F':' '{print $2}' | awk -F',' '{print $1}' | sed 's/\\ //g'"),shell=True, stdout=subprocess.PIPE)

restful = obj.stdout.read()
print restful

def main():
mongodb_user_connections()

if __name__ == "__main__":
main()/<code>

1.3.2:添加到配置文件、添加监控项、添加触发器、添加图形、最终图形:

略略略!


分享到:


相關文章: