【问题标题】:Prometheus Alert for Multiple Deployments多个部署的 Prometheus 警报
【发布时间】:2021-03-31 17:15:08
【问题描述】:

我需要为运行在 kubernetes 集群上的给定应用程序的许多实例公开的 prometheus 指标实施警报。

警报必须以以下格式在 .yaml 文件中创建:

- name: some-alert-name
  interval: 30s
  rules:
  - alert: name-alert
    expr: <Expression To Make>
    labels:
      event_id: XXXXX
    annotations:
      description: "Project {{ $labels.kubernetes_namespace }} / App {{ $labels.app }} / Pod {{ $labels.kubernetes_pod_name }} / Instance {{ $labels.instance }}."
      summary: "{{ $labels.kubernetes_namespace }}"

应用于警报的条件类似于:givenMetricValue > 4

我在获取所有实例的指标值方面没有问题,我可以这样做:metricName{app=~"common-part-of-deployments-name-.*"}"

我的麻烦在于有一个独特的警报,如果其中一个满足条件,就会触发一个表达式。

这可能吗? 如果是这样,我该怎么做?

【问题讨论】:

    标签: kubernetes alert monitoring prometheus prometheus-alertmanager


    【解决方案1】:

    事实证明,如果您想使用通用的“所有获取”表达式创建警报,例如

    metricName{app=~"common-part-of-deployments-name-.*"}"

    将针对正则表达式匹配的每个部署触发警报。因此,您只需要一个带有通用表达式的警报。

    【讨论】:

      猜你喜欢
      • 2021-10-13
      • 1970-01-01
      • 2019-01-29
      • 1970-01-01
      • 1970-01-01
      • 2021-11-22
      • 2021-12-23
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多