【发布时间】:2022-01-06 08:52:06
【问题描述】:
alertmanager 有什么方法可以在触发警报后停止连续触发警报?
例如,我设置了一些警报规则来检查服务的正常运行时间。如果其中一项服务出现故障,则 alertmanager 将不会停止发送警报消息,直到问题得到解决。
【问题讨论】:
标签: prometheus prometheus-alertmanager
alertmanager 有什么方法可以在触发警报后停止连续触发警报?
例如,我设置了一些警报规则来检查服务的正常运行时间。如果其中一项服务出现故障,则 alertmanager 将不会停止发送警报消息,直到问题得到解决。
【问题讨论】:
标签: prometheus prometheus-alertmanager
您描述的是inhibition rule。当其他警报触发时,它可以抑制警报。以下是 Alertmanager 最新版本的基本示例:
# for alerts with equal 'instance' label
- equal: ['instance']
# if one has 'severity' label equal to 'critical'
source_matchers:
- severity = critical
# and the other has 'warning'
target_matchers:
- severity = warning
# then mute the other one (with severity 'warning')
已弃用的旧样式:
- equal: ['instance']
source_match:
severity: critical
target_match:
severity: warning
【讨论】: