【发布时间】:2020-10-12 09:58:27
【问题描述】:
我在 Prometheus 中定义了一个基本的“service_down”警报来捕获系统的状态: 然后,我尝试使用以下配置从警报管理器中挂钩此警报:
global:
resolve_timeout: 5m
route:
group_by: ['service_down']
group_wait: 10s
group_interval: 10s
repeat_interval: 1h
receiver: 'web.hook'
receivers:
- name: 'web.hook'
webhook_configs:
- url: 'http://127.0.0.1:5001/'
inhibit_rules:
- source_match:
severity: 'critical'
target_match:
severity: 'warning'
equal: ['service_down', 'dev', 'instance']
但是,我在警报管理器中看不到任何警报: 我对 Prometheus 还很陌生,但无法运行这个非常基本的示例。有什么帮助吗? 谢谢
【问题讨论】:
-
标签
service_down真的存在吗?
标签: prometheus prometheus-alertmanager