【问题标题】:Unable to see Alerts in Prometheus Alert Manager在 Prometheus 警报管理器中看不到警报
【发布时间】:2020-10-12 09:58:27
【问题描述】:

我在 Prometheus 中定义了一个基本的“service_down”警报来捕获系统的状态: 然后,我尝试使用以下配置从警报管理器中挂钩此警报:

global:
  resolve_timeout: 5m

route:
  group_by: ['service_down']
  group_wait: 10s
  group_interval: 10s
  repeat_interval: 1h
  receiver: 'web.hook'
receivers:
- name: 'web.hook'
  webhook_configs:
  - url: 'http://127.0.0.1:5001/'
inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['service_down', 'dev', 'instance']

但是,我在警报管理器中看不到任何警报: 我对 Prometheus 还很陌生,但无法运行这个非常基本的示例。有什么帮助吗? 谢谢

【问题讨论】:

  • 标签service_down真的存在吗?

标签: prometheus prometheus-alertmanager


【解决方案1】:

乍一看,您对 Alertmanager 的配置不正确 查看您的 group_by(使用标签名称而不是值)和 inhibit_rules 配置

https://prometheus.io/docs/alerting/latest/configuration/

AM 日志上应该有一些错误。

如果您仍然看不到 AM 检查 Prometheus 状态的警报,它包含使用服务发现时的 AM 实例列表。

如果您仍然有问题...我建议启用调试日志并检查 Promethues 是否无法将 POST 请求发送到 AM 或者它是否正在处理它

【讨论】:

    【解决方案2】:

    在我的情况下,问题是身份验证。我的警报管理器服务器使用简单身份验证,您应该将 simple_auth 配置添加到您的 promethues.yml 文件的 alerting 部分

    ...
    alerting:
      alertmanagers:
        - scheme : "https"
        - api_version: "v1"
        - basic_auth:
            username: username
            password: "password"
        - static_configs:
            - targets:
                [
                  "servicenameindocker:9093",
                  "serveripaddr:9093",
                  "serverlink:9093",
                ]
    ...
    

    关于目标部分'servicenameindocker:9093'是使用docker的情况下的docker服务名。

    希望对你有帮助。

    【讨论】:

      猜你喜欢
      • 2021-12-23
      • 2020-04-15
      • 1970-01-01
      • 1970-01-01
      • 2020-02-28
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多