【发布时间】:2014-10-15 16:14:36
【问题描述】:
我刚刚在工作中得到了这个任务,这太让我头疼了。我们有一个 nagios 监控脚本,它运行并运行进程检查。我们有一个 NFS 服务器最近出现了问题,如果它出现故障,所有挂载它的机器都会开始无法通过进程检查,因为 NFS 挂载并且挂起 SNMP 检查。
检查脚本是一个使用 NET::SNMP 库的 perl nagios 脚本。我很确定它只是通用的 nagios 脚本。该脚本位于http://nagios.manubulon.com/check_snmp_process.pl
请帮助我了解发生了什么。
编辑:有问题的 nfs 挂载适用于需要硬挂载的 oracle RMAN 备份。
【问题讨论】:
-
插件究竟为受影响的系统返回了什么?未知?危急?是否有相关的错误消息? SNMP 超时了吗?
-
错误:警报信号(Nagios 超时)它正在超时。如果我缩短脚本的超时时间,我会得到:错误:进程名称表:远程主机“x.x.x.x”没有响应。
-
Enable debugging for
Net::SNMP并从命令行手动运行插件以查看它挂断的确切位置。