需要将prometheus的报警规则存放在/etc/rules里面的yml文件中   同时prometheus的yaml文件需要开启alertmanager,通过alertmanager触发告警到各个平台,例如钉钉。

原创-prometheus报警规则

 

 ---

rules.yml文件

groups:

   - name: api-server /报警名

     rules:

     - alert: api-server_cnt /报警规则名称

       for: 3m /持续时间

       annotations: /报警的内容

       labels: /打标签

         severity: error

         classification: lyz

         workline: xdrive

     - alert: InstanceGone
       for: 10s
       expr: absent(up{job="node"})
       annotations:
           summary: "host {{ $labels.instance }} is no longer reporting"
       labels:
       severity: critical
       classification: lyz2
       workline: xdrive

---

接着需要在alertmanager的配置文件中更新路由和接收者:

原创-prometheus报警规则

 

这里定义默认接收者为lyz,同时routes使用分支路由,匹配标签为serverity为critical的告警规则,发送给lyz2

---

最后需要在dingtalk组件中定义你的接收者发送地址,这个百度即可解决。

---

重启prometheus

---

如果成功,则可以在页面中看到

 

---

一旦触发警告,则可以在alertmanager控制台中看到

原创-prometheus报警规则

注意,这里silence可以配置静默时间,可永久或暂停告警。

 

---

接着可以在钉钉等看到告警通知

原创-prometheus报警规则

 

---

告警成功。

 

相关文章:

  • 2022-12-23
  • 2021-12-20
  • 2022-02-04
  • 2022-03-08
  • 2021-09-06
  • 2021-06-21
  • 2021-08-26
  • 2021-07-16
猜你喜欢
  • 2022-03-06
  • 2022-12-23
  • 2021-07-21
  • 2021-05-27
  • 2021-08-17
  • 2021-12-05
相关资源
相似解决方案