【问题标题】:Prometheus alert manager configuration in openshiftopenshift 中的 Prometheus 警报管理器配置
【发布时间】:2019-05-06 11:12:33
【问题描述】:

我有一个要求,客户希望将一些警报配置为强制性警报。以下是我希望了解有关警报的更多信息的几个参数。我试图获取这些参数的详细信息,但在任何地方都找不到。

KubeDeploymentReplicasMismatch
KubeStatefulSetReplicasMismatch
KubeStatefulSetGenerationMismatch
KubeDaemonSetRolloutStuck

谁能告诉我在哪里可以找到有关这些参数的更多信息?

【问题讨论】:

    标签: kubernetes openshift grafana prometheus


    【解决方案1】:

    您可以将配置验证到prometheus-k8s-rulefiles-0ConfigMap

    仅供参考,

    # oc get cm prometheus-k8s-rulefiles-0 -o yaml -n openshift-monitoring | \
      grep -E 'KubeDeploymentReplicasMismatch|KubeStatefulSetReplicasMismatch|KubeStatefulSetGenerationMismatch|KubeDaemonSetRolloutStuck'
          - alert: KubeDeploymentReplicasMismatch
          - alert: KubeStatefulSetReplicasMismatch
          - alert: KubeStatefulSetGenerationMismatch
          - alert: KubeDaemonSetRolloutStuck
    

    【讨论】:

      【解决方案2】:

      作为一个选项,可以在 prometheus 仪表板/rules 中找到完整的警报配置。或状态-> 规则菜单。

      警报的最佳理由是消息本身,以及运行手册参考 https://github.com/kubernetes-monitoring/kubernetes-mixin/blob/master/runbook.md

      【讨论】:

        【解决方案3】:

        这些是 Prometheus 警报的名称。你可以查看这个 repo:https://github.com/coreos/kube-prometheus

        您提供的所有警报都列在此处:https://github.com/coreos/kube-prometheus/blob/master/manifests/prometheus-rules.yaml

        KubeStatefulSetReplicasMismatch - StatefulSet 与预期的副本数量不匹配超过 15 分钟。

        KubeStatefulSetGenerationMismatch - StatefulSet 生成不匹配,这表示 StatefulSet 失败但尚未回滚。

        KubeDeploymentReplicasMismatch - 部署与预期的副本数量不匹配超过一个小时。

        KubeDaemonSetRolloutStuck - 只有 {{ $value }}% 的所需 DaemonSet Pod 被调度并准备就绪。

        【讨论】:

        • 我正在寻找上述警报的详细描述,例如使用它们的原因。我正在寻找一些文档,我可以在其中找到有关这些警报的所有详细信息。您能否提供我在哪里可以找到所有这些警报详细信息的详细方式。
        • 我认为没有任何文档。您必须熟悉 Prometheus 查询才能理解这些警报。 AFAIK,没有此类警报的详细描述,因此您可以将其展示给您的老板或某​​人。但无论如何,祝你好运,我尽我所能。
        • 谁能告诉我这些警报使用了什么,如果出现此警报,应该如何解决它?请告诉我。 KubeStatefulSetReplicasMismatch KubeStatefulSetGenerationMismatch
        猜你喜欢
        • 2021-12-23
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2020-04-15
        • 1970-01-01
        • 2020-02-28
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多