【问题标题】:Prometheus alert manager AWS definitionPrometheus 警报管理器 AWS 定义
【发布时间】:2021-10-18 22:23:39
【问题描述】:

我正在尝试通过 AWS 工作区配置在我的 EKS 集群上运行的 Prometheus 警报管理器。现在从我目前所读到的内容来看,这是更新配置的唯一方法,并且不可能通过 eksctl/helm 来完成。

现在你可以通过它做两件事:

  1. 规则管理 - 它要求您上传带有命名空间的 .yaml “命名空间包含定义记录和警报规则的规则组。” - 这里是规则 yaml 文件,我对他们给出的基本解释还算满意,但不是那么多,我希望有更多:https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-ruler-rulesfile.html

  2. 警报管理器 - “添加警报管理器定义以开始路由、禁止和静音警报。”几乎不言自明,(重要的是:我使用 slack 作为接收器,但是我这样做没有将 SNS 和 Lambda 配置为 AWS requires you to do! )。现在,当我开始上传 .yaml 到那里时,我得到“格式错误的 Alertmanager 定义”。这是一个经过验证的有效 yaml 文件!

配置如下:

alertmanager_config: |
  route:
    group_by: ['alertname']
    group_wait: 10s
    group_interval: 10s
    repeat_interval: 1m
    receiver: 'slack_notifications'
  receivers:
    - name: 'slack_notifications'
      slack_configs:
    - api_url: 'https://hooks.slack.com/services/ooga/booga/key'
        channel: '#slack-monitoring'
        send_resolved: true
  inhibit_rules:
    - source_match:
        severity: 'critical'
      target_match:
        severity: 'warning'
      equal: ['alertname', 'dev', 'instasnce'] 

我已经尝试了上述的不同变体,但都没有奏效......

到目前为止,有没有人处理过这个问题并通过 AWS Workspaces 成功配置了 Prometheus?互联网上没有任何关于它的信息,我知道这是 AWS 发布的一项相当新的服务,但几乎没有社区对它的支持:(

干杯, 弗拉特科

【问题讨论】:

    标签: amazon-web-services prometheus monitoring prometheus-alertmanager


    【解决方案1】:

    Amazon Managed Service 目前支持的唯一警报接收器 Prometheus 是 Amazon Simple Notification Service (Amazon SNS)

    来自here

    此外,this 文档也很有用,因为 sns_configs 中的属性和必需的块不受支持。

    【讨论】:

    • 嗨 Dmitrii,感谢您回来。所以这只是证实了我对它的怀疑,实际上只能通过 SNS 配置它,然后发送到 Slack 或我希望在另一端的任何接收器。
    猜你喜欢
    • 2021-12-23
    • 1970-01-01
    • 1970-01-01
    • 2020-04-15
    • 1970-01-01
    • 2020-02-28
    • 1970-01-01
    • 1970-01-01
    • 2019-01-29
    相关资源
    最近更新 更多