【发布时间】:2021-03-31 17:15:08
【问题描述】:
我需要为运行在 kubernetes 集群上的给定应用程序的许多实例公开的 prometheus 指标实施警报。
警报必须以以下格式在 .yaml 文件中创建:
- name: some-alert-name
interval: 30s
rules:
- alert: name-alert
expr: <Expression To Make>
labels:
event_id: XXXXX
annotations:
description: "Project {{ $labels.kubernetes_namespace }} / App {{ $labels.app }} / Pod {{ $labels.kubernetes_pod_name }} / Instance {{ $labels.instance }}."
summary: "{{ $labels.kubernetes_namespace }}"
应用于警报的条件类似于:givenMetricValue > 4
我在获取所有实例的指标值方面没有问题,我可以这样做:metricName{app=~"common-part-of-deployments-name-.*"}"
我的麻烦在于有一个独特的警报,如果其中一个满足条件,就会触发一个表达式。
这可能吗? 如果是这样,我该怎么做?
【问题讨论】:
标签: kubernetes alert monitoring prometheus prometheus-alertmanager