【问题标题】:How can I add alerts in Prometheus + AlertManager to certain Prometheus Job Names?如何在 Prometheus + AlertManager 中将警报添加到某些 Prometheus 作业名称?
【发布时间】:2018-10-10 17:45:13
【问题描述】:

我为几个团队运行 prometheus 实例,我希望能够为各个团队管理的服务器添加警报。

一个例子可能比我能解释的更清楚:

假设 Team-A 想要添加一些服务器以供 Prometheus 监控。此外,他们希望在某些情况下(内存不足、停机等)发出警报。

目前,通过我的设置,所有作业名称中的所有服务器都使用相同的规则集进行监控和警报。我想要的是这样的:

Docker-Servers 收到警报组警报-A
Nginx-Servers 收到警报组警报-B

我不确定要在 Prometheus.yml 和 alert.rules.yml 文件中做什么才能实现这一点。

感谢任何帮助。

【问题讨论】:

    标签: prometheus prometheus-alertmanager


    【解决方案1】:

    我终于弄明白了。

    在 alertmanager 的 alert.rules.yml 文件中,您可以在 'expr' 行中指定正则表达式。

    例如,如果我想监控服务器“test1”、“test2”、“test3”的停机时间,您可以执行以下操作:

    expr: up{job=~"test1|test2|test3"} == 0
    

    【讨论】:

      猜你喜欢
      • 2020-02-24
      • 2022-07-13
      • 2021-12-11
      • 2016-03-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多