【发布时间】:2021-10-18 22:23:39
【问题描述】:
我正在尝试通过 AWS 工作区配置在我的 EKS 集群上运行的 Prometheus 警报管理器。现在从我目前所读到的内容来看,这是更新配置的唯一方法,并且不可能通过 eksctl/helm 来完成。
现在你可以通过它做两件事:
-
规则管理 - 它要求您上传带有命名空间的 .yaml “命名空间包含定义记录和警报规则的规则组。” - 这里是规则 yaml 文件,我对他们给出的基本解释还算满意,但不是那么多,我希望有更多:https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-ruler-rulesfile.html
-
警报管理器 - “添加警报管理器定义以开始路由、禁止和静音警报。”几乎不言自明,(重要的是:我使用 slack 作为接收器,但是我这样做没有将 SNS 和 Lambda 配置为 AWS requires you to do! )。现在,当我开始上传 .yaml 到那里时,我得到“格式错误的 Alertmanager 定义”。这是一个经过验证的有效 yaml 文件!
配置如下:
alertmanager_config: |
route:
group_by: ['alertname']
group_wait: 10s
group_interval: 10s
repeat_interval: 1m
receiver: 'slack_notifications'
receivers:
- name: 'slack_notifications'
slack_configs:
- api_url: 'https://hooks.slack.com/services/ooga/booga/key'
channel: '#slack-monitoring'
send_resolved: true
inhibit_rules:
- source_match:
severity: 'critical'
target_match:
severity: 'warning'
equal: ['alertname', 'dev', 'instasnce']
我已经尝试了上述的不同变体,但都没有奏效......
到目前为止,有没有人处理过这个问题并通过 AWS Workspaces 成功配置了 Prometheus?互联网上没有任何关于它的信息,我知道这是 AWS 发布的一项相当新的服务,但几乎没有社区对它的支持:(
干杯, 弗拉特科
【问题讨论】:
标签: amazon-web-services prometheus monitoring prometheus-alertmanager