【问题标题】:Prometheus Trigger Single Alert if set of nodes are down如果一组节点关闭,Prometheus 触发单一警报
【发布时间】:2022-07-30 01:39:02
【问题描述】:

我在我的 prometheus 服务器上配置了以下目标。所有服务器都在 Target1.yml 文件中配置,路由器详细信息存储在 Router.yml 文件中。每个站点都有唯一的 4 位数字,在此示例中为“1234”。所以像这样我们有 1000 个站点 (总共 10005 个节点)*。每当路由器出现故障或断电时,我们都会为每个站点总共收到 5 条警报。

Target1.yml

node1-1234.example.com
node2-1234.example.com
node3-1234.example.com
node1-4567.example.com
node2-4567.example.com
node3-4567.example.com

Router.yml

router1-1234.example.com
router2-1234.example.com
router1-4567.example.com
router2-4567.example.com

我正在寻找一种解决方案,以便在断电时仅触发路由器警报,而忽略 node1/node2/node3。你能帮忙看看如何实现吗?

【问题讨论】:

    标签: prometheus prometheus-alertmanager alertmanager


    【解决方案1】:

    看来你可以使用https://github.com/prometheus/blackbox_exporterhttps://github.com/czerwonk/ping_exporter

    然后根据导出的指标创建警报规则

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-04-26
      • 1970-01-01
      • 2020-01-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-03-19
      相关资源
      最近更新 更多