参考地址:https://www.chenghuajie.cn/906.html
首先,监控硬盘状态分为几种情况:
1、如果zabbix官方提供监控模板,直接导入应用就行,像我前面写过的dell R720等服务器。
2、参考地址里面写的主要监控方式是分区,这样的如果我一个磁盘阵列12块硬盘,这些硬盘就划了一个分区,这样监控没有意义。真的就是死就死了,只不过死了以后你能第一时间知道罢了。
3、也是我下面要说的这种情况,我不监控分区。使用场景是如果磁盘整列做了RAID5,死一块硬盘,及时替换上去新的硬盘,这样就没有问题了。最多也是等他重新给新硬盘同步一份数据,并不影响使用,真正能做到故障第一之间发现。
硬件需求:
1、python 2.6.6
2、CentOS release 6.5
3、服务器型号DELL T410
4、因为使用的是zabbix_agentd配置文件,所以这个台服务器必须是安装了zabbix_agentd。
5、zabbix3.2.6
一、MegaCli工具
1、安装就不在这里阐述了,网上一搜一大堆。
Slot Number: 11 #硬盘编号,一个组是从0开始计算,依次类推。
Media Error Count: 0 #坏道,如果硬盘出现问题,这个值就不会等于0
Other Error Count: 0 #硬盘松动,越需要注意
Firmware state: Online, Spun Up #在线状态
2、安装方式:
打开https://www.broadcom.com/support/download-search,在这里面搜索MegaCli
下载下来以后copy到系统脸里面直接rpm -ivh安装即可。
命令位置在 /opt/MegaRAID/MegaCli/MegaCli64
#/opt/MegaRAID/MegaCli/MegaCli64 -LDInfo -Lall -aALL #查看raid级别 #/opt/MegaRAID/MegaCli/MegaCli64 -AdpAllInfo -aALL #查看raid卡信息 #/opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL #查看硬盘信息 #/opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -aAll #查看电池信息 #/opt/MegaRAID/MegaCli/MegaCli64 -FwTermLog -Dsply -aALL #查看raid卡日志 #/opt/MegaRAID/MegaCli/MegaCli64 -adpCount #显示适配器个数 #/opt/MegaRAID/MegaCli/MegaCli64 -AdpGetTime –aALL #显示适配器时间 #/opt/MegaRAID/MegaCli/MegaCli64 -LDInfo -LALL -aAll #显示所有逻辑磁盘组信息 #/opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -GetBbuStatus -aALL |grep 'Charger Status' #查看电池充电状态 #/opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -GetBbuStatus -aALL #显示BBU状态信息 #/opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -GetBbuCapacityInfo -aALL #显示BBU容量信息 #/opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -GetBbuDesignInfo -aALL #显示BBU设计参数 #/opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -GetBbuProperties -aALL #显示当前BBU属性 #/opt/MegaRAID/MegaCli/MegaCli64 -cfgdsply -aALL #显示raid卡型号,raid设置,disk相关信息