【问题标题】:Nagios Core Summary Macro has Wrong CountNagios 核心摘要宏的计数错误
【发布时间】:2021-09-09 14:13:31
【问题描述】:

我认为以下摘要宏不考虑被动服务: $TOTALSERVICESCRITICALUNHANDLED$(这是我直接看到问题的那个) 我假设以下两个有同样的问题: $TOTALSERVICESWARNING未处理$ $TOTALSERVICESUKNOWNANDLED$ 未处于停机状态且未得到确认的被动服务正确地显示在 Nagios Core 的未处理服务页面中。 但是,我使用的脚本会吐出 $TOTALSERVICESCRITICALUNHANDLED$ 的值,该值不考虑非停机、非确认和处于临界状态的被动服务。 这个宏上的文字表明该服务必须“启用检查”,但这可能不考虑被动检查?: " 此宏反映当前处于 CRITICAL 状态且当前未被“处理”的服务的总数。未处理的服务问题是那些未被确认、当前未处于计划停机时间且当前已启用检查的问题。 "

我的设置: 我有一个由定期安排的服务执行的命令。该命令将宏 $TOTALSERVICESCRITICALUNHANDLED$ 的值传递给脚本。 该脚本只是回显该宏的值。

测试: 除了我的被动服务启用了被动服务并处于临界状态之外,所有服务都处于停机状态。该脚本为未处理的严重警报的数量吐出“0”(这是不正确的!) 在被动服务上启用主动检查,脚本现在告诉我“1”

Nagios 核心版本 4.3.2 请告知这是否是更高版本中解决的错误,或者是否有任何解决方法? 我已经看到了这个在 4.2.2 中修复的相关问题,但这是一个不同的问题:viewtopic.php?t=39957

【问题讨论】:

    标签: nagios


    【解决方案1】:

    我最终对源代码进行了此更改。我可以假设服务是否处于停机状态或已被确认,它已经不计入警报总数。所以对 checks_enabled 的检查是多余的,并且错误地抛出了被动服务(似乎 checks_enabled 是一个只代表 ACTIVE 检查的标志)

    common/macros.c 从第 1216 行开始: 注释掉它检查的 3 个实例,每个 2 行 "if(temp_service->checks_enabled == FALSE) 问题 = FALSE

    (然后重建 Nagios Core)

    我能看到这种情况再次困扰我的唯一方法是,如果活动服务的活动检查被禁用并且也没有处于停机时间或确认状态

    【讨论】:

      猜你喜欢
      • 2020-04-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-01-20
      • 1970-01-01
      • 1970-01-01
      • 2011-10-30
      相关资源
      最近更新 更多