array(2) {
  ["docs"]=>
  array(10) {
    [0]=>
    array(10) {
      ["id"]=>
      string(3) "428"
      ["text"]=>
      string(77) "Visual Studio 2017 单独启动MSDN帮助（Microsoft Help Viewer）的方法"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(8) "DonetRen"
      ["tagsname"]=>
      string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer"
      ["tagsid"]=>
      string(23) "[401,402,403,"300",404]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400964"
      ["_id"]=>
      string(3) "428"
    }
    [1]=>
    array(10) {
      ["id"]=>
      string(3) "427"
      ["text"]=>
      string(42) "npm -v；报错 cannot find module "wrapp""
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "zzty"
      ["tagsname"]=>
      string(50) "node.js|npm|cannot find module &quot;wrapp“|node"
      ["tagsid"]=>
      string(19) "[398,"239",399,400]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400760"
      ["_id"]=>
      string(3) "427"
    }
    [2]=>
    array(10) {
      ["id"]=>
      string(3) "426"
      ["text"]=>
      string(54) "说说css中pt、px、em、rem都扮演了什么角色"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(12) "zhengqiaoyin"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511400640"
      ["_id"]=>
      string(3) "426"
    }
    [3]=>
    array(10) {
      ["id"]=>
      string(3) "425"
      ["text"]=>
      string(83) "深入学习JS执行--创建执行上下文（变量对象，作用域链，this）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "Ry-yuan"
      ["tagsname"]=>
      string(33) "Javascript|Javascript执行过程"
      ["tagsid"]=>
      string(13) "["169","191"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511399901"
      ["_id"]=>
      string(3) "425"
    }
    [4]=>
    array(10) {
      ["id"]=>
      string(3) "424"
      ["text"]=>
      string(30) "C# 排序技术研究与对比"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "vveiliang"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(8) ".Net Dev"
      ["catesid"]=>
      string(5) "[199]"
      ["createtime"]=>
      string(10) "1511399150"
      ["_id"]=>
      string(3) "424"
    }
    [5]=>
    array(10) {
      ["id"]=>
      string(3) "423"
      ["text"]=>
      string(72) "【算法】小白的算法笔记：快速排序算法的编码和优化"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(9) "penghuwan"
      ["tagsname"]=>
      string(6) "算法"
      ["tagsid"]=>
      string(7) "["344"]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511398109"
      ["_id"]=>
      string(3) "423"
    }
    [6]=>
    array(10) {
      ["id"]=>
      string(3) "422"
      ["text"]=>
      string(64) "JavaScript数据可视化编程学习（二）Flotr2，雷达图"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "chengxs"
      ["tagsname"]=>
      string(28) "数据可视化|前端学习"
      ["tagsid"]=>
      string(9) "[396,397]"
      ["catesname"]=>
      string(18) "前端基本知识"
      ["catesid"]=>
      string(5) "[198]"
      ["createtime"]=>
      string(10) "1511397800"
      ["_id"]=>
      string(3) "422"
    }
    [7]=>
    array(10) {
      ["id"]=>
      string(3) "421"
      ["text"]=>
      string(36) "C#表达式目录树（Expression）"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(4) "wwym"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(4) ".NET"
      ["catesid"]=>
      string(7) "["119"]"
      ["createtime"]=>
      string(10) "1511397474"
      ["_id"]=>
      string(3) "421"
    }
    [8]=>
    array(10) {
      ["id"]=>
      string(3) "420"
      ["text"]=>
      string(47) "数据结构 队列_队列实例：事件处理"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(7) "idreamo"
      ["tagsname"]=>
      string(40) "C语言|数据结构|队列|事件处理"
      ["tagsid"]=>
      string(23) "["246","247","248",395]"
      ["catesname"]=>
      string(12) "数据结构"
      ["catesid"]=>
      string(7) "["133"]"
      ["createtime"]=>
      string(10) "1511397279"
      ["_id"]=>
      string(3) "420"
    }
    [9]=>
    array(10) {
      ["id"]=>
      string(3) "419"
      ["text"]=>
      string(47) "久等了,博客园官方Android客户端发布"
      ["intro"]=>
      string(288) "目录

ECharts
异步加载


ECharts
数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。
chart.setOption({
    color: [
        "
      ["username"]=>
      string(3) "cmt"
      ["tagsname"]=>
      string(0) ""
      ["tagsid"]=>
      string(2) "[]"
      ["catesname"]=>
      string(0) ""
      ["catesid"]=>
      string(2) "[]"
      ["createtime"]=>
      string(10) "1511396549"
      ["_id"]=>
      string(3) "419"
    }
  }
  ["count"]=>
  int(200)
}
222<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="utf-8" />
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="content-language" content="zh-CN" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" /> 
    <title>Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警 - 爱码网</title>
     
<meta name="keywords" content="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" />
<meta name="description" content="目录ECharts异步加载ECharts数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具，而是在交互、性能、数据处理等方面有更高的要求。chart.setOption({    color: [" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<link rel="stylesheet" type="text/css" href="/statics/css/base.css?v=2.7" />
<script src="/statics/js/detail.min.js?v=2.2"></script>   
<script>
   $(document).ready(function () { 
		$("img").error(function () {
			$(this).hide();
		}); 
	}); 
</script>
</head>
<body class="home-template dtpg">
<nav class="main-nav clearfix">
    <div class="inner">
        <ul class="nav">
            <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/" title="爱码网">首页</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/1.html" title="前端技术">前端技术</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/9.html" title="编程语言">编程语言</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/31.html" title="人工智能">人工智能</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/41.html" title="运维知识">运维知识</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/52.html" title="资源下载">资源下载</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/68.html" title="常用小工具">常用小工具</a></li>
                        <li class="menu-item menu-item-type-custom menu-item-object-custom current-menu-item current_page_item menu-item-home menu-item-886"><a href="/nav/72.html" title="技术问答">技术问答</a></li>
                    </ul>            
	 
    </div>
</nav><div class="site-wrapper">
 
    <header style="height: auto;padding: 10px 0px;" class="main-header">
        <div style="max-width:910px" class="main-header-content inner">
                        <h1 class="page-title"><a href="/show-307865755.html" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警">Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警</a></h1>
            
        </div>

    </header>
    <main class="content" role="main">
	

        <div class="leftbox">
    <article class="post tag-uifont tag-webview">
        <header class="post-header">
            <footer class="tc">  
                <time class="post-date" datetime="2022-12-23">2022-12-23</time>
            </footer>
        </header>
        <section class="post-content">
            <div class="contentbef">  
                  
                              </div>

            
<p>高可用集群参见<a class="ng-star-inserted" href="/default/index/url?u=aHR0cHM6Ly93d3cuY25ibG9ncy5jb20veGlhb3lvdTIwMTgvcC8xNDI0MzA5OS5odG1s" rel="nofollow" target="_blank">https://www.cnblogs.com/xiaoyou2018/p/14243099.html</a></p>
<p> </p>
<p>服务器公网IP：122.226.xx.220</p>
<p>服务器内网IP：192.168.1.190</p>
<p> 采用docker安装Prometheus、grafana、altermanager、cadvisor</p>
<p>实现对服务器硬件、容器、web站点、接口返回内容、证书的监控</p>
<p>mkdir -p /data/prometheus</p>
<p>cd !$</p>
<p>mkdir -p {conf,prometheus,rules}</p>
<p>cd /data/prometheus/conf</p>
<p>vi prometheus.yml         <span style="background-color: rgba(255, 255, 0, 1)"> (yml文件格式一定要注意“空格”，要全部对齐、一致，不然报错,每次修改完后热更一下Prometheus服务)</span></p>
<div class="likecs_code">
<p>global:<br>  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.(拉取 targets 的默认时间间隔)<br>  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.(执行 rules 的时间间隔)<br>  # scrape_timeout is set to the global default (10s).</p>
<p># Alertmanager configuration<br>alerting:<br>  alertmanagers:<br>    - static_configs:<br>        - targets: ['192.168.1.190:9093']</p>
<p># Load rules once and periodically evaluate them according to the global 'evaluation_interval'.<br>rule_files:<br>  - "/etc/prometheus/rules/*.yml"   <br>  - "rules.yml"<br>  #- "node_down.yml"<br>  #- "memory.yml"<br>  # - "first_rules.yml"<br>  # - "second_rules.yml"</p>
<p># A scrape configuration containing exactly one endpoint to scrape:<br># Here it's Prometheus itself.<br>scrape_configs:<br>  # The job name is added as a label `job=&lt;job_name&gt;` to any timeseries scraped from this config.<br>  - job_name: 'prometheus'<br>    static_configs:<br>      - targets: ['122.226.xx.220:9090']</p>
<p>  - job_name: 'cadvisor'<br>    static_configs:<br>      - targets: ['122.226.xx.220:8080','192.168.1.213:8080','192.168.1.215:8080','192.168.1.216:8080','192.168.1.53:8080','192.168.1.54:8080']<br>  # 以下为各节点类型分组<br>  # 数仓服务器<br>  - job_name: '数仓服务器'<br>    scrape_interval: 8s<br>    static_configs:<br>      - targets: ['192.168.1.45:9100','192.168.1.46:9100','192.168.1.47:9100','192.168.1.48:9100','192.168.1.44:9100','192.168.1.51:9100','192.168.1.52:9100','192.168.1.23:9100','192.168.1.211:9100','192.168.1.202:9100','192.168.1.203:9<br>100','192.168.1.23:9100','192.168.1.61:9100']</p>
<p>  #测试环境K8S服务器<br>  - job_name: '测试环境K8S服务器'<br>    scrape_interval: 8s<br>    static_configs:<br>      - targets: ['192.168.1.213:9100','192.168.1.215:9100','192.168.1.216:9100','192.168.1.53:9100','192.168.1.54:9100']<br># web站点检测<br>  - job_name: "<span style="background-color: rgba(255, 255, 0, 1)">blackbox_web</span>"<br>    metrics_path: /probe<br>    params:<br>      module: [http_2xx]  # Look for a HTTP 200 response.<br>    file_sd_configs:<br>    - refresh_interval: 1m<br>      files:<br>      - "<span style="background-color: rgba(255, 255, 0, 1)">/etc/prometheus/blackbox-dis.yml</span>"<br>    relabel_configs:<br>    - source_labels: [__address__]<br>      target_label: __param_target<br>    - source_labels: [__param_target]<br>      target_label: instance<br>    - target_label: __address__<br>      replacement: 192.168.1.190:9115</p>
<p># 接口返回内容检测<br>  - job_name: "<span style="background-color: rgba(255, 255, 0, 1)">blackbox_check</span>"<br>    metrics_path: /probe<br>    params:<br>      module: [http_2xx_check]  # Look for a HTTP 200 response.<br>    file_sd_configs:<br>    - refresh_interval: 1m<br>      files:<br>      - "<span style="background-color: rgba(255, 255, 0, 1)">/etc/prometheus/blackbox-check.yml</span>"<br>    relabel_configs:<br>    - source_labels: [__address__]<br>      target_label: __param_target<br>    - source_labels: [__param_target]<br>      target_label: instance<br>    - target_label: __address__<br>      replacement: 192.168.1.190:9115</p>
<p>#端口检测<br>  - job_name: 'blackbox_tcp'<br>    metrics_path: /probe<br>    params:<br>      module: [tcp_connect]<br>    static_configs:<br>      - targets:<br>        - 192.168.1.45:9100<br>        - 192.168.1.190:9093<br>        - 192.168.1.212:6380</p>
<p>    relabel_configs:<br>      - source_labels: [__address__]<br>        target_label: __param_target<br>      - source_labels: [__param_target]<br>        target_label: instance<br>      - target_label: __address__<br>        replacement: 192.168.1.190:9115 # Blackbox exporter</p>


</div>
<p><span style="background-color: rgba(255, 255, 0, 1)">热更新</span></p>
<div class="likecs_code">
<pre>curl -X POST http:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">122.226.xx.220:9090/-/reload</span></pre>
</div>
<p> </p>
<p>vi alertmanager.yml</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 0, 1)">global:
  resolve_timeout: 5m
route:
  group_by: [</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">alertname</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">]   # 分组名
  receiver: webhook
  group_wait: 30s           # 当收到告警的时候，等待十秒看是否还有告警，如果有就一起发出去  
  group_interval: 1m        # 各个分组之间发送警告间隔时间 
  repeat_interval: 48h       # 重复报警的间隔时间

receivers:
</span>-<span style="color: rgba(0, 0, 0, 1)"> name: webhook
  webhook_configs:
  </span>- url: http:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">192.168.1.190:8060/dingtalk/webhook1/send </span>
    send_resolved: <span style="color: rgba(0, 0, 255, 1)">true</span><span style="color: rgba(0, 0, 0, 1)">
inhibit_rules:            #告警收敛
  </span>-<span style="color: rgba(0, 0, 0, 1)"> source_match:
      severity: </span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">critical</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">
    target_match:
      severity: </span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">warning</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">
    equal: [</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">alertname</span><span style="color: rgba(128, 0, 0, 1)">'</span>, <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">dev</span><span style="color: rgba(128, 0, 0, 1)">'</span>, <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">instance</span><span style="color: rgba(128, 0, 0, 1)">'</span>]</pre>
</div>
<p>vi  docker-compose-monitor.yml</p>
<div class="likecs_code">
<pre>version: <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">2</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">

networks:
  monitor:
    driver: bridge

services:
  prometheus:
    image: prom</span>/<span style="color: rgba(0, 0, 0, 1)">prometheus
    container_name: prometheus
    </span><span style="color: rgba(0, 0, 255, 1)">hostname</span><span style="color: rgba(0, 0, 0, 1)">: prometheus
    restart: always
    volumes:
      </span>- /data/prometheus/conf/prometheus.yml:/etc/prometheus/<span style="color: rgba(0, 0, 0, 1)">prometheus.yml<br>      - /data/prometheus/prometheus:/prometheus
      </span>- /data/prometheus/rules/:/etc/prometheus/rules<br>      - /etc/localtime:/etc/<span style="color: rgba(0, 0, 0, 1)">localtime
    command:
      [ </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">--config.file=/etc/prometheus/prometheus.yml</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">,
        </span>"--web.enable-lifecycle",<br>        "--web.enable-admin-api",<br><em><span>       ] </span></em></pre>
<pre><em>    ports:
      - <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">9090:9090</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">
    networks:
      </span>-<span style="color: rgba(0, 0, 0, 1)"> monitor

  alertmanager:
    image: prom</span>/<span style="color: rgba(0, 0, 0, 1)">alertmanager
    container_name: alertmanager
    </span><span style="color: rgba(0, 0, 255, 1)">hostname</span><span style="color: rgba(0, 0, 0, 1)">: alertmanager
    restart: always
    volumes:
      </span>- /data/prometheus/conf/alertmanager.yml:/etc/alertmanager/<span style="color: rgba(0, 0, 0, 1)">alertmanager.yml<br>      - /etc/localtime:/etc/localtime</span></em></pre>
<pre><span style="color: rgba(0, 0, 0, 1)">    ports:
      </span>- <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">9093:9093</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">
    networks:
      </span>-<span style="color: rgba(0, 0, 0, 1)"> monitor

  grafana:
    image: grafana</span>/<span style="color: rgba(0, 0, 0, 1)">grafana
    container_name: grafana
    </span><span style="color: rgba(0, 0, 255, 1)">hostname</span><span style="color: rgba(0, 0, 0, 1)">: grafana
    restart: always
    ports:
      </span>- <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">3000:3000</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">
    networks:
      </span>-<span style="color: rgba(0, 0, 0, 1)"> monitor

 # node</span>-<span style="color: rgba(0, 0, 0, 1)">exporter:
 #  image: quay.io</span>/prometheus/node-<span style="color: rgba(0, 0, 0, 1)">exporter
 #  container_name: node</span>-<span style="color: rgba(0, 0, 0, 1)">exporter
 #   </span><span style="color: rgba(0, 0, 255, 1)">hostname</span>: node-<span style="color: rgba(0, 0, 0, 1)">exporter
 #   restart: always
 #   ports:
 #     </span>- <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">9100:9100</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">
 #   networks:
 #     </span>-<span style="color: rgba(0, 0, 0, 1)"> monitor

  cadvisor:
    image: google</span>/<span style="color: rgba(0, 0, 0, 1)">cadvisor:latest
    container_name: cadvisor
    </span><span style="color: rgba(0, 0, 255, 1)">hostname</span><span style="color: rgba(0, 0, 0, 1)">: cadvisor
    restart: always
    volumes:
      </span>- /:/<span style="color: rgba(0, 0, 0, 1)">rootfs:ro
      </span>- /var/run:/var/<span style="color: rgba(0, 0, 0, 1)">run:rw
      </span>- /sys:/<span style="color: rgba(0, 0, 0, 1)">sys:ro
      </span>- /var/lib/docker/:/var/lib/<span style="color: rgba(0, 0, 0, 1)">docker:ro
    ports:
      </span>- <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">8080:8080</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">
    networks:
      </span>- monitor</pre>
</div>
<p> # 使用docker-composer命令启动yml里配置好的各容器</p>
<div class="likecs_code">
<pre>docker-compose -f /data/prometheus/conf/docker-compose-monitor.yml up -d</pre>
</div>
<p>#删除所有创建的容器</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 0, 1)"># 删除容器：
docker</span>-compose -f /data/prometheus/conf/docker-compose-monitor.yml <span style="color: rgba(0, 0, 255, 1)">kill</span><span style="color: rgba(0, 0, 0, 1)">
docker</span>-compose -f /data/prometheus/conf/docker-compose-monitor.yml <span style="color: rgba(0, 0, 255, 1)">rm</span></pre>
</div>
<p>脚本安装node-exporter</p>
<div class="likecs_code">
<pre>#!/bin/<span style="color: rgba(0, 0, 0, 1)">bash
#Supports System：Ubuntu16.</span><span style="color: rgba(128, 0, 128, 1)">04</span><span style="color: rgba(0, 0, 0, 1)">，CentOS7


cd </span>/<span style="color: rgba(0, 0, 0, 1)">opt
</span><span style="color: rgba(0, 0, 255, 1)">wget</span> https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">github.com/prometheus/node_exporter/releases/download/v1.0.1/node_exporter-1.0.1.linux-amd64.tar.gz</span>
<span style="color: rgba(0, 0, 255, 1)">tar</span> -zxvf node_exporter-<span style="color: rgba(128, 0, 128, 1)">1.0</span>.<span style="color: rgba(128, 0, 128, 1)">1</span>.linux-amd64.<span style="color: rgba(0, 0, 255, 1)">tar</span><span style="color: rgba(0, 0, 0, 1)">.gz
</span><span style="color: rgba(0, 0, 255, 1)">mv</span> /opt/node_exporter-<span style="color: rgba(128, 0, 128, 1)">1.0</span>.<span style="color: rgba(128, 0, 128, 1)">1</span>.linux-<span style="color: rgba(0, 0, 0, 1)">amd64  node_exporter
#</span><span style="color: rgba(0, 0, 255, 1)">rm</span> -rf /opt/node_exporter-<span style="color: rgba(128, 0, 128, 1)">1.0</span>.<span style="color: rgba(128, 0, 128, 1)">1</span>.linux-amd64.<span style="color: rgba(0, 0, 255, 1)">tar</span><span style="color: rgba(0, 0, 0, 1)">.gz


groupadd prometheus
useradd </span>-g prometheus -s /sbin/nologin prometheus -<span style="color: rgba(0, 0, 0, 1)">M
</span><span style="color: rgba(0, 0, 255, 1)">chown</span> -R prometheus:prometheus /opt/<span style="color: rgba(0, 0, 0, 1)">node_exporter

</span><span style="color: rgba(0, 0, 255, 1)">cat</span> &gt; node_exporter.service &lt;&lt;<span style="color: rgba(0, 0, 0, 1)"> EOF
[Unit]
Description</span>=<span style="color: rgba(0, 0, 0, 1)">node_exporter
Documentation</span>=https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">prometheus.io/</span>
After=<span style="color: rgba(0, 0, 0, 1)">network.target

[Service]
Type</span>=<span style="color: rgba(0, 0, 0, 1)">simple
User</span>=<span style="color: rgba(0, 0, 0, 1)">prometheus
ExecStart</span>=/opt/node_exporter/<span style="color: rgba(0, 0, 0, 1)">node_exporter
Restart</span>=on-<span style="color: rgba(0, 0, 0, 1)">failure

[Install]
WantedBy</span>=multi-<span style="color: rgba(0, 0, 0, 1)">user.target
EOF

</span><span style="color: rgba(0, 0, 255, 1)">mv</span> /opt/node_exporter.service /etc/systemd/system/
<span style="color: rgba(0, 0, 255, 1)">chown</span> prometheus:prometheus /etc/systemd/system/<span style="color: rgba(0, 0, 0, 1)">node_exporter.service

systemctl daemon</span>-<span style="color: rgba(0, 0, 0, 1)">reload
systemctl start node_exporter.service
systemctl enable node_exporter.service

</span><span style="color: rgba(0, 0, 255, 1)">echo</span> <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">请使用curl localhost:9100命令测试是否安装成功</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p>cadvisor安装</p>
<div class="likecs_code">
<pre>docker run -d -p <span style="color: rgba(128, 0, 128, 1)">8080</span>:<span style="color: rgba(128, 0, 128, 1)">8080</span> --name cadvisor -v /:/rootfs:ro -v /var/run:/var/run:rw -v /sys:/sys:ro -v /var/lib/docker/:/var/lib/docker:ro -v /dev/disk/:/dev/disk:ro google/cadvisor:latest    </pre>
</div>
<p>blackbox_exporter 安装</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 255, 1)">wget</span> https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">github.com/prometheus/blackbox_exporter/releases/download/v0.18.0/blackbox_exporter-0.18.0.linux-amd64.tar.gz</span>
<span style="color: rgba(0, 0, 255, 1)">tar</span> -zxvf blackbox_exporter-<span style="color: rgba(128, 0, 128, 1)">0.18</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>.linux-amd64.<span style="color: rgba(0, 0, 255, 1)">tar</span>.gz  -C /usr/local/
<span style="color: rgba(0, 0, 255, 1)">mv</span> /usr/local/blackbox_exporter-<span style="color: rgba(128, 0, 128, 1)">0.18</span>.<span style="color: rgba(128, 0, 128, 1)">0</span>.linux-amd64/  /usr/local/<span style="color: rgba(0, 0, 0, 1)">blackbox
</span><span style="color: rgba(0, 0, 255, 1)">vi</span> /etc/systemd/system/<span style="color: rgba(0, 0, 0, 1)">blackbox_exporter.service 
[Unit]
Description</span>=<span style="color: rgba(0, 0, 0, 1)">blackbox_exporter
After</span>=<span style="color: rgba(0, 0, 0, 1)">network.target 

[Service]
WorkingDirectory</span>=/usr/local/<span style="color: rgba(0, 0, 0, 1)">blackbox
ExecStart</span>=/usr/local/blackbox/<span style="color: rgba(0, 0, 0, 1)">blackbox_exporter \
         </span>--config.<span style="color: rgba(0, 0, 255, 1)">file</span>=/usr/local/blackbox/<span style="color: rgba(0, 0, 0, 1)">blackbox.yml
[Install]
WantedBy</span>=multi-user.target<br><br></pre>
<p>systemctl start blackbox_exporter<br>systemctl enable blackbox_exporter</p>


</div>
<p>修改配置文件，实现监控网站和监控网站、接口返回内容<span style="background-color: rgba(255, 255, 0, 1)">（修改完后要重启blackbox服务）</span></p>
<p>cd /usr/local/blackbox/</p>
<p>vi blackbox.yml</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 0, 1)">modules:
  http_2xx:
    prober: http 
  http_2xx_check:
    prober: http
  # 下面这段是需要添加的内容
    timeout: 5s 
    http:
      #valid_http_versions: [</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">HTTP/1.1</span><span style="color: rgba(128, 0, 0, 1)">"</span>, <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">HTTP/2</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">]   
      valid_status_codes: []
      method: GET
      #headers:
        #Host:test.kaboy.net</span>/<span style="color: rgba(0, 0, 0, 1)">MessageMon.aspx 
        #Accept</span>-Language: en-<span style="color: rgba(0, 0, 0, 1)">US
        #Origin:test.kaboy.net
      <span style="background-color: rgba(255, 255, 0, 1)">fail_if_body_matches_regexp:</span>    # 如果我get的url地址返回的正文中有</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">fail</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">,那么就会失败,则probe_success值为0
        </span>- <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">#fail#</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)"><span style="background-color: rgba(255, 255, 0, 1)">
      fail_if_body_not_matches_regexp</span>:
        </span>- <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">#SUCCESS#</span><span style="color: rgba(128, 0, 0, 1)">"</span>    # 如果我get的url地址返回的正文中没有<span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">success</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">,那么就会失败,则probe_success值为0

  http_post_2xx:
    prober: http
    http:
      method: POST
  tcp_connect:
    prober: tcp
  pop3s_banner:
    prober: tcp
    tcp:
      query_response:
      </span>- expect: <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">^+OK</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      tls: </span><span style="color: rgba(0, 0, 255, 1)">true</span><span style="color: rgba(0, 0, 0, 1)">
      tls_config:
        insecure_skip_verify: </span><span style="color: rgba(0, 0, 255, 1)">false</span><span style="color: rgba(0, 0, 0, 1)">
  ssh_banner:
    prober: tcp
    tcp:
      query_response:
      </span>- expect: <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">^SSH-2.0-</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
  irc_banner:
    prober: tcp
    tcp:
      query_response:
      </span>- send: <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">NICK prober</span><span style="color: rgba(128, 0, 0, 1)">"</span>
      - send: <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">USER prober prober prober :prober</span><span style="color: rgba(128, 0, 0, 1)">"</span>
      - expect: <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">PING :([^ ]+)</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
        send: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">PONG ${1}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
      - expect: <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">^:[^ ]+ 001</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
  icmp:
    prober: icmp</span></pre>
</div>
<p><span style="background-color: rgba(255, 255, 0, 1)">进入容器创建blackbox-dis.yml、blackbox-check.yml</span></p>
<div class="likecs_code">
<pre>docker exec -it prometheus /bin/<span style="color: rgba(0, 0, 255, 1)">sh</span></pre>
</div>
<p> </p>
<p>vi /etc/prometheus/blackbox-dis.yml</p>
<div class="likecs_code">
<pre>-<span style="color: rgba(0, 0, 0, 1)"> targets:
   </span>- https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">meeuapp.cn</span>
  #- https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">test.kaboy.net/MessageMon.aspx</span>
  #- https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">www.baidu.com</span></pre>
</div>
<p>vi /etc/prometheus/blackbox-check.yml</p>
<div class="likecs_code">
<pre>-<span style="color: rgba(0, 0, 0, 1)"> targets:
  #</span>- https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">meeuapp.cn</span>
  - https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">test.kaboy.net/MessageMon.aspx   #这个站点返回值是success</span>
  #- https:<span style="color: rgba(0, 128, 0, 1)">//</span><span style="color: rgba(0, 128, 0, 1)">www.baidu.com</span></pre>
</div>
<div class="likecs_code">
<pre>systemctl restart blackbox_exporter</pre>
</div>
<p> </p>
<p>创建rule规则文件</p>
<p>vi /data/prometheus/rules/node_exporter.yml</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 255, 1)">groups</span><span style="color: rgba(0, 0, 0, 1)">:
    </span>- name: 主机状态-<span style="color: rgba(0, 0, 0, 1)">监控告警
      rules:
      </span>-<span style="color: rgba(0, 0, 0, 1)"> alert: 主机状态
        </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: up == <span style="color: rgba(128, 0, 128, 1)">0</span>
        <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1m
        labels:
          status: 非常严重
        annotations:
          summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.instance}}:服务器宕机</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
          description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.instance}}:服务器延时超过5分钟</span><span style="color: rgba(128, 0, 0, 1)">"</span>
      
      -<span style="color: rgba(0, 0, 0, 1)"> alert: CPU使用情况
        </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: <span style="color: rgba(128, 0, 128, 1)">100</span>-(avg(irate(node_cpu_seconds_total{mode=<span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">idle</span><span style="color: rgba(128, 0, 0, 1)">"</span>}[5m])) by(instance)* <span style="color: rgba(128, 0, 128, 1)">100</span>) &gt; <span style="color: rgba(128, 0, 128, 1)">80</span>
        <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1m
        labels:
          status: 一般告警
        annotations:
          summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint}} CPU使用率过高！</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
          description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint }} CPU使用大于80%(目前使用:{{$value}}%)</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  
      -<span style="color: rgba(0, 0, 0, 1)"> alert: 内存使用
        </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: round(<span style="color: rgba(128, 0, 128, 1)">100</span>- node_memory_MemAvailable_bytes/node_memory_MemTotal_bytes*<span style="color: rgba(128, 0, 128, 1)">100</span>) &gt; <span style="color: rgba(128, 0, 128, 1)">90</span>
        <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1m
        labels:
          severity: warning
        annotations:
          summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">内存使用率过高</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
          description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">当前使用率{{ $value }}%</span><span style="color: rgba(128, 0, 0, 1)">"</span>

      -<span style="color: rgba(0, 0, 0, 1)"> alert: IO性能
        </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: <span style="color: rgba(128, 0, 128, 1)">100</span>-(avg(irate(node_disk_io_time_seconds_total[1m])) by(instance)* <span style="color: rgba(128, 0, 128, 1)">100</span>) &lt; <span style="color: rgba(128, 0, 128, 1)">60</span>
        <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1m
        labels:
          status: 严重告警
        annotations:
          summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint}} 流入磁盘IO使用率过高！</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
          description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint }} 流入磁盘IO大于60%(目前使用:{{$value}})</span><span style="color: rgba(128, 0, 0, 1)">"</span>
 
      -<span style="color: rgba(0, 0, 0, 1)"> alert: 网络
        </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: ((<span style="color: rgba(0, 0, 255, 1)">sum</span>(rate (node_network_receive_bytes_total{device!~<span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">tap.*|veth.*|br.*|docker.*|virbr*|lo*</span><span style="color: rgba(128, 0, 0, 1)">'</span>}[5m])) by (instance)) / <span style="color: rgba(128, 0, 128, 1)">100</span>) &gt; <span style="color: rgba(128, 0, 128, 1)">102400</span>
        <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1m
        labels:
          status: 严重告警
        annotations:
          summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint}} 流入网络带宽过高！</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
          description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint }}流入网络带宽持续2分钟高于100M. RX带宽使用率{{$value}}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
      
      -<span style="color: rgba(0, 0, 0, 1)"> alert: TCP会话
        </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: node_netstat_Tcp_CurrEstab &gt; <span style="color: rgba(128, 0, 128, 1)">1000</span>
        <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1m
        labels:
          status: 严重告警
        annotations:
          summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint}} TCP_ESTABLISHED过高！</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
          description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint }} TCP_ESTABLISHED大于1000%(目前使用:{{$value}}%)</span><span style="color: rgba(128, 0, 0, 1)">"</span>
 
      -<span style="color: rgba(0, 0, 0, 1)"> alert: 磁盘容量
        </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: <span style="color: rgba(128, 0, 128, 1)">100</span>-(node_filesystem_free_bytes{fstype=~<span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">ext4|xfs</span><span style="color: rgba(128, 0, 0, 1)">"</span>}/node_filesystem_size_bytes {fstype=~<span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">ext4|xfs</span><span style="color: rgba(128, 0, 0, 1)">"</span>}*<span style="color: rgba(128, 0, 128, 1)">100</span>) &gt; <span style="color: rgba(128, 0, 128, 1)">90</span>
        <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1m
        labels:
          status: 严重告警
        annotations:
          summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint}} 磁盘分区使用率过高！</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
          description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.mountpoint }} 磁盘分区使用大于90%(目前使用:{{$value}}%)</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p>vi /data/prometheus/rules/blackbox_exporter.yml</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 255, 1)">groups</span><span style="color: rgba(0, 0, 0, 1)">:
</span>- name: 站点状态-<span style="color: rgba(0, 0, 0, 1)">监控告警
  rules:
  </span>-<span style="color: rgba(0, 0, 0, 1)"> alert: 网络检测
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: probe_success == <span style="color: rgba(128, 0, 128, 1)">0</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1m
    labels:
      status: 严重告警
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.instance}} 不能访问</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">{{$labels.instance}} 不能访问</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p>vi /data/prometheus/rules/ssl.yml</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 255, 1)">groups</span><span style="color: rgba(0, 0, 0, 1)">:
</span>-<span style="color: rgba(0, 0, 0, 1)"> name: check_ssl_status
  rules:
  </span>- alert: <span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">ssl证书过期警告</span><span style="color: rgba(128, 0, 0, 1)">"</span>
    <span style="color: rgba(0, 0, 255, 1)">expr</span>: (probe_ssl_earliest_cert_expiry - <span style="color: rgba(0, 0, 255, 1)">time</span>())/<span style="color: rgba(128, 0, 128, 1)">86400</span> &lt;<span style="color: rgba(128, 0, 128, 1)">15</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 1h
    labels:
      severity: warn
    annotations:
      description: </span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">域名{{$labels.instance}}的证书还有{{ printf "%.1f" $value }}天就过期了,请尽快更新证书</span><span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(0, 0, 0, 1)">
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">ssl证书过期警告</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p>vi /data/prometheus/rules/docker.yml</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 255, 1)">groups</span><span style="color: rgba(0, 0, 0, 1)">:
</span>-<span style="color: rgba(0, 0, 0, 1)"> name:  Docker containers monitoring
  rules: 
  </span>-<span style="color: rgba(0, 0, 0, 1)"> alert: ContainerKilled
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: <span style="color: rgba(0, 0, 255, 1)">time</span>() - container_last_seen &gt; <span style="color: rgba(128, 0, 128, 1)">60</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container killed (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">A container has disappeared\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: ContainerCpuUsage
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: (<span style="color: rgba(0, 0, 255, 1)">sum</span>(rate(container_cpu_usage_seconds_total[3m])) BY (instance, name) * <span style="color: rgba(128, 0, 128, 1)">100</span>) &gt; <span style="color: rgba(128, 0, 128, 1)">80</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container CPU usage (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container CPU usage is above 80%\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: ContainerMemoryUsage
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: (<span style="color: rgba(0, 0, 255, 1)">sum</span>(container_memory_usage_bytes) BY (instance, name) / <span style="color: rgba(0, 0, 255, 1)">sum</span>(container_spec_memory_limit_bytes) BY (instance, name) * <span style="color: rgba(128, 0, 128, 1)">100</span>) &gt; <span style="color: rgba(128, 0, 128, 1)">80</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container Memory usage (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container Memory usage is above 80%\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: ContainerVolumeUsage
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: (<span style="color: rgba(128, 0, 128, 1)">1</span> - (<span style="color: rgba(0, 0, 255, 1)">sum</span>(container_fs_inodes_free) BY (instance) / <span style="color: rgba(0, 0, 255, 1)">sum</span>(container_fs_inodes_total) BY (instance)) * <span style="color: rgba(128, 0, 128, 1)">100</span>) &gt; <span style="color: rgba(128, 0, 128, 1)">80</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container Volume usage (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container Volume usage is above 80%\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: ContainerVolumeIoUsage
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: (<span style="color: rgba(0, 0, 255, 1)">sum</span>(container_fs_io_current) BY (instance, name) * <span style="color: rgba(128, 0, 128, 1)">100</span>) &gt; <span style="color: rgba(128, 0, 128, 1)">80</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container Volume IO usage (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container Volume IO usage is above 80%\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: ContainerHighThrottleRate
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: rate(container_cpu_cfs_throttled_seconds_total[3m]) &gt; <span style="color: rgba(128, 0, 128, 1)">1</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container high throttle rate (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Container is being throttled\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: PgbouncerActiveConnectinos
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: pgbouncer_pools_server_active_connections &gt; <span style="color: rgba(128, 0, 128, 1)">200</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">PGBouncer active connectinos (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">PGBouncer pools are filling up\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: PgbouncerErrors
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: increase(pgbouncer_errors_count{errmsg!=<span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">server conn crashed?</span><span style="color: rgba(128, 0, 0, 1)">"</span>}[5m]) &gt; <span style="color: rgba(128, 0, 128, 1)">10</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">PGBouncer errors (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">PGBouncer is logging errors. This may be due to a a server restart or an admin typing commands at the pgbouncer console.\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: PgbouncerMaxConnections
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: rate(pgbouncer_errors_count{errmsg=<span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">no more connections allowed (max_client_conn)</span><span style="color: rgba(128, 0, 0, 1)">"</span>}[1m]) &gt; <span style="color: rgba(128, 0, 128, 1)">0</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: critical
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">PGBouncer max connections (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">The number of PGBouncer client connections has reached max_client_conn.\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: SidekiqQueueSize
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: sidekiq_queue_size{} &gt; <span style="color: rgba(128, 0, 128, 1)">100</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: warning
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Sidekiq queue size (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Sidekiq queue {{ $labels.name }} is growing\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: SidekiqSchedulingLatencyTooHigh
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: max(sidekiq_queue_latency) &gt; <span style="color: rgba(128, 0, 128, 1)">120</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: critical
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Sidekiq scheduling latency too high (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Sidekiq jobs are taking more than 2 minutes to be picked up. Users may be seeing delays in background processing.\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: ConsulServiceHealthcheckFailed
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: consul_catalog_service_node_healthy == <span style="color: rgba(128, 0, 128, 1)">0</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: critical
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Consul service healthcheck failed (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Service: `{{ $labels.service_name }}` Healthcheck: `{{ $labels.service_id }}`\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: ConsulMissingMasterNode
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: consul_raft_peers &lt; <span style="color: rgba(128, 0, 128, 1)">3</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: critical
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Consul missing master node (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Numbers of consul raft peers should be 3, in order to preserve quorum.\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span>
  -<span style="color: rgba(0, 0, 0, 1)"> alert: ConsulAgentUnhealthy
    </span><span style="color: rgba(0, 0, 255, 1)">expr</span>: consul_health_node_status{status=<span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">critical</span><span style="color: rgba(128, 0, 0, 1)">"</span>} == <span style="color: rgba(128, 0, 128, 1)">1</span>
    <span style="color: rgba(0, 0, 255, 1)">for</span><span style="color: rgba(0, 0, 0, 1)">: 5m
    labels:
      severity: critical
    annotations:
      summary: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">Consul agent unhealthy (instance {{ $labels.instance }})</span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(0, 0, 0, 1)">
      description: </span><span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">A Consul agent is down\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p> </p>
<p>Prometheus</p>
<p>http://122.226.xx.220:9090/</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXdMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNVFEwTkRZMU9TOHlNREl3TVRJdk1UUTBORFkxT1MweU1ESXdNVEl3TkRFMU1qTXpOamd3TXkwMk1qYzJPVEV6T0RNdWNHNW4=" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" loading="lazy" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p> <img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXdMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNVFEwTkRZMU9TOHlNREl3TVRJdk1UUTBORFkxT1MweU1ESXdNVEl3TkRFMU1qWXlNall5TmkweE56YzJOemMzTnpNekxuQnVadz09" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" loading="lazy" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p> </p>
<p> </p>
<p> </p>
<p> grafana</p>
<p>http://122.226.xx.220:3000/</p>
<p>node exporter模板8919</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXdMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNVFEwTkRZMU9TOHlNREl3TVRJdk1UUTBORFkxT1MweU1ESXdNVEl3TkRFMU1qUXpOakkxT0MweE9USXdPRFV3TVRZNUxuQnVadz09" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" loading="lazy" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p> black exporter模板9965  7587</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXdMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNVFEwTkRZMU9TOHlNREl3TVRJdk1UUTBORFkxT1MweU1ESXdNVEl3TkRFMU16WXlOREU1TWkweE5EUXdPVE14TmpJd0xuQnVadz09" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" loading="lazy" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p> </p>
<p> docker 模板 193</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXdMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNVFEwTkRZMU9TOHlNREl3TVRJdk1UUTBORFkxT1MweU1ESXdNVEl3TkRFMU16YzBPVEUwTUMweE5ETXdPREU0TVRVMkxuQnVadz09" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" loading="lazy" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p> </p>
<p> </p>
<p> 钉钉告警</p>
<h3>钉钉添加机器人</h3>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNEb3ZMM0ZwYm1sMUxucG9iM1YzWlc1NmFHVnVMblJ2Y0M5eGFXNXBkVWx0Wnk5a2FXNW5aR2x1WnlWRk5pVkNOeVZDUWlWRk5TVTRRU1ZCTUNWRk5pVTVReVZDUVNWRk5TVTVPU1ZCT0NWRk5DVkNRU1ZDUVM1d2JtYz0=" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNEb3ZMM0ZwYm1sMUxucG9iM1YzWlc1NmFHVnVMblJ2Y0M5eGFXNXBkVWx0Wnk5a2FXNW5aR2x1WnkxM1pXSm9iMjlyTG5CdVp3PT0=" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p>钉钉机器人的webhook: <a href="https://www.zhouwenzhen.top/go/aHR0cHM6Ly9vYXBpLmRpbmd0YWxrLmNvbS9yb2JvdC9zZW5kP2FjY2Vzc190b2tlbj14eHg=" target="_blank" rel="nofollow">https://oapi.dingtalk.com/robot/send?access_token=xxx</a></p>
<p> </p>
<p> 使用docker安装Prometheus-webhook-dingtalk</p>
<div class="likecs_code">
<pre>docker pull timonwong/prometheus-webhook-<span style="color: rgba(0, 0, 0, 1)">dingtalk
docker run </span>-d --restart always --name dingding -p <span style="color: rgba(128, 0, 128, 1)">8060</span>:<span style="color: rgba(128, 0, 128, 1)">8060</span> -v /etc/localtime:/etc/localtime timonwong/prometheus-webhook-dingtalk --ding.profile=<span style="color: rgba(128, 0, 0, 1)">"</span><span style="color: rgba(128, 0, 0, 1)">webhook1=https://oapi.dingtalk.com/robot/send?access_token=xxxxxxx</span><span style="color: rgba(128, 0, 0, 1)">"</span></pre>
</div>
<p>当触发rule规则时</p>
<p>网站检测、接口返回内容检测</p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXdMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNVFEwTkRZMU9TOHlNREl3TVRJdk1UUTBORFkxT1MweU1ESXdNVEl3TkRFMU16TXdOalkxTUMwMk1UazVNell5TmpZdWNHNW4=" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" loading="lazy" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p> </p>
<p> </p>
<p><img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXdMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNVFEwTkRZMU9TOHlNREl3TVRJdk1UUTBORFkxT1MweU1ESXdNVEl3TkRFMU16TTFOVFV5TmkweE1UQTVOVEU0T0RZekxuQnVadz09" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" loading="lazy" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p> </p>
<p> <img src="/default/index/img?u=L2RlZmF1bHQvaW5kZXgvaW1nP3U9YUhSMGNITTZMeTlwYldjeU1ESXdMbU51WW14dlozTXVZMjl0TDJKc2IyY3ZNVFEwTkRZMU9TOHlNREl3TVRJdk1UUTBORFkxT1MweU1ESXdNVEl3TkRFMU16UTBOemM1TkMweE1USXhOemM0TlRjeExuQnVadz09" alt="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警" loading="lazy" title="Prometheus+grafana+alertmanager+node_exporter+blackbox_exporter+cadvisor+钉钉告警"></p>
<p> </p>
<p> </p>
<p>问题：</p>
<p>1、docker启动 cAdvisor报错</p>
<p>Could not configure a source for OOM detection, disabling OOM events: open /dev/kmsg: no such file or directory<br>Failed to start container manager: inotify_add_watch /sys/fs/cgroup/cpuacct,cpu: no such file or directory</p>
<p>解决：</p>
<div class="likecs_code">
<pre><span style="color: rgba(0, 0, 255, 1)">mount</span> -o remount,rw <span style="color: rgba(128, 0, 0, 1)">'</span><span style="color: rgba(128, 0, 0, 1)">/sys/fs/cgroup</span><span style="color: rgba(128, 0, 0, 1)">'</span>
<span style="color: rgba(0, 0, 255, 1)">ln</span> -s /sys/fs/cgroup/cpu,cpuacct /sys/fs/cgroup/<span style="color: rgba(0, 0, 0, 1)">cpuacct,cpu
docker restart cadvisor</span></pre>
</div>
<p> </p>
<p>2、blackbox exporter模板报错</p>
<p>Panel plugin not found: grafana-piechart-panel</p>
<p>解决：</p>
<div class="likecs_code">
<pre>grafana-cli plugins <span style="color: rgba(0, 0, 255, 1)">install</span> grafana-piechart-panel</pre>
</div>
<p> </p>
 
                    
                <div style="margin-top: 10px;">
                  </div> 
        </section>
	 
        <footer class="post-footer">
            <section class="author">
                                            </section>
        </footer>
        <p class="mt10">相关文章：</p>
        <div style="width: 100%;" class="contentcard">
      
            <div style="width: 100%;height: auto;" class="carditem litem clearfix"> 
                    <ul style="padding-left: 0rem;" class="cardcont">
                                            </ul>
               </div>   
         </div>
    </article>

  
</div>

<div class="rigthbox contentcard mt10">
 
          <div style="height: auto;" class="carditem litem">
    <div class="cardtit">猜你喜欢 </div>
        <ul class="cardcont">
                        </ul>
   </div> 

<div style="height: auto;" class="carditem litem">
    <div class="cardtit">相关资源 </div>
        <ul class="cardcont">
              
                            </ul>
   </div>
   
    <div style="height: auto;" class="carditem litem">
     <div class="cardtit">相似解决方案 </div>
         <ul class="cardcont">
                          </ul>
    </div>
  
   <div style="height: auto;background-color: #ddd;text-align: center;" class="carditem litem">
    <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
</div> 
   <div  style="height: auto;" class="carditem litem mt20">
    <div class="cardtit">热门标签  </div>
    <div class="tagbox">
                    <a target="_blank" title="Java" href="/default/index/tags?cid=164&cname=Java" >Java</a>
                        <a target="_blank" title="Python" href="/default/index/tags?cid=367&cname=Python" >Python</a>
                        <a target="_blank" title="linux" href="/default/index/tags?cid=274&cname=linux" >linux</a>
                        <a target="_blank" title="javascript" href="/default/index/tags?cid=169&cname=javascript" >javascript</a>
                        <a target="_blank" title="Mysql" href="/default/index/tags?cid=237&cname=Mysql" >Mysql</a>
                        <a target="_blank" title="C#" href="/default/index/tags?cid=187&cname=C%23" >C#</a>
                        <a target="_blank" title="Docker" href="/default/index/tags?cid=243&cname=Docker" >Docker</a>
                        <a target="_blank" title="算法" href="/default/index/tags?cid=344&cname=%E7%AE%97%E6%B3%95" >算法</a>
                        <a target="_blank" title="前端" href="/default/index/tags?cid=160&cname=%E5%89%8D%E7%AB%AF" >前端</a>
                        <a target="_blank" title="SpringBoot" href="/default/index/tags?cid=168&cname=SpringBoot" >SpringBoot</a>
                        <a target="_blank" title="Redis" href="/default/index/tags?cid=227&cname=Redis" >Redis</a>
                        <a target="_blank" title="Vue" href="/default/index/tags?cid=236&cname=Vue" >Vue</a>
                        <a target="_blank" title="spring" href="/default/index/tags?cid=696&cname=spring" >spring</a>
                        <a target="_blank" title="设计模式" href="/default/index/tags?cid=632&cname=%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F" >设计模式</a>
                        <a target="_blank" title=".net core" href="/default/index/tags?cid=381&cname=.net+core" >.net core</a>
                        <a target="_blank" title=".net" href="/default/index/tags?cid=300&cname=.net" >.net</a>
                        <a target="_blank" title="kubernetes" href="/default/index/tags?cid=2179&cname=kubernetes" >kubernetes</a>
                        <a target="_blank" title="c++" href="/default/index/tags?cid=312&cname=c%2B%2B" >c++</a>
                        <a target="_blank" title="数据库" href="/default/index/tags?cid=284&cname=%E6%95%B0%E6%8D%AE%E5%BA%93" >数据库</a>
                        <a target="_blank" title="数据结构" href="/default/index/tags?cid=247&cname=%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84" >数据结构</a>
                        <a target="_blank" title="大数据" href="/default/index/tags?cid=888&cname=%E5%A4%A7%E6%95%B0%E6%8D%AE" >大数据</a>
                        <a target="_blank" title="js" href="/default/index/tags?cid=159&cname=js" >js</a>
                        <a target="_blank" title="机器学习" href="/default/index/tags?cid=171&cname=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0" >机器学习</a>
                        <a target="_blank" title="微服务" href="/default/index/tags?cid=832&cname=%E5%BE%AE%E6%9C%8D%E5%8A%A1" >微服务</a>
                        <a target="_blank" title="Android" href="/default/index/tags?cid=282&cname=Android" >Android</a>
                        <a target="_blank" title="Go" href="/default/index/tags?cid=839&cname=Go" >Go</a>
                        <a target="_blank" title="程序员" href="/default/index/tags?cid=327&cname=%E7%A8%8B%E5%BA%8F%E5%91%98" >程序员</a>
                        <a target="_blank" title="面试" href="/default/index/tags?cid=637&cname=%E9%9D%A2%E8%AF%95" >面试</a>
                        <a target="_blank" title="JVM" href="/default/index/tags?cid=727&cname=JVM" >JVM</a>
                        <a target="_blank" title="ASP.net core" href="/default/index/tags?cid=179&cname=ASP.net+core" >ASP.net core</a>
                        <a target="_blank" title="云原生" href="/default/index/tags?cid=22056&cname=%E4%BA%91%E5%8E%9F%E7%94%9F" >云原生</a>
                        <a target="_blank" title="人工智能" href="/default/index/tags?cid=270&cname=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD" >人工智能</a>
                        <a target="_blank" title="后端" href="/default/index/tags?cid=1089&cname=%E5%90%8E%E7%AB%AF" >后端</a>
                        <a target="_blank" title="PHP" href="/default/index/tags?cid=281&cname=PHP" >PHP</a>
                        <a target="_blank" title="git" href="/default/index/tags?cid=226&cname=git" >git</a>
                        <a target="_blank" title="CSS" href="/default/index/tags?cid=817&cname=CSS" >CSS</a>
                        <a target="_blank" title="golang" href="/default/index/tags?cid=409&cname=golang" >golang</a>
                        <a target="_blank" title="k8s" href="/default/index/tags?cid=5067&cname=k8s" >k8s</a>
                        <a target="_blank" title="Nginx" href="/default/index/tags?cid=373&cname=Nginx" >Nginx</a>
                        <a target="_blank" title="Django" href="/default/index/tags?cid=634&cname=Django" >Django</a>
                        <a target="_blank" title="mybatis" href="/default/index/tags?cid=720&cname=mybatis" >mybatis</a>
                        <a target="_blank" title="深度学习" href="/default/index/tags?cid=345&cname=%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0" >深度学习</a>
                        <a target="_blank" title="多线程" href="/default/index/tags?cid=986&cname=%E5%A4%9A%E7%BA%BF%E7%A8%8B" >多线程</a>
                        <a target="_blank" title="React" href="/default/index/tags?cid=560&cname=React" >React</a>
                        <a target="_blank" title="架构" href="/default/index/tags?cid=2070&cname=%E6%9E%B6%E6%9E%84" >架构</a>
                        <a target="_blank" title="devops" href="/default/index/tags?cid=2662&cname=devops" >devops</a>
                        <a target="_blank" title="爬虫" href="/default/index/tags?cid=905&cname=%E7%88%AC%E8%99%AB" >爬虫</a>
                        <a target="_blank" title="云计算" href="/default/index/tags?cid=361&cname=%E4%BA%91%E8%AE%A1%E7%AE%97" >云计算</a>
                        <a target="_blank" title="Spring Boot" href="/default/index/tags?cid=201&cname=Spring+Boot" >Spring Boot</a>
                        <a target="_blank" title="LeetCode" href="/default/index/tags?cid=342&cname=LeetCode" >LeetCode</a>
                </div>
       
   </div>
   
        <div id="rightadbox" style="height: 300px;background-color: #ddd;text-align: center;" class="carditem litem">
            <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-5446233687289962" data-ad-slot="2607637140"  data-ad-format="auto"  data-full-width-responsive="true"></ins><script>(adsbygoogle = window.adsbygoogle || []).push({});</script>
        </div> 
</div>
<div class="clearfix"></div>
</main>
    
<div class="yllinks alink"></div>
 

<footer class="site-footer clearfix">
<section class="copyright">By &copy; 2026 <a href="/" title="www.likecs.com">likecs</a> 版权所有,<br/>本站所有数据收集于网络如有侵犯到您的权益请联系 进行下架处理1。 </section>
<section class="poweredby">  <a target="_blank" href="https://beian.miit.gov.cn/">粤ICP备22038628号</a>Powered By  WordPress </section>
<script charset="UTF-8" id="LA_COLLECT" src="//sdk.51.la/js-sdk-pro.min.js"></script>
<script>LA.init({id: "Je3PjbvUssp6BbvY",ck: "Je3PjbvUssp6BbvY"})</script>
<script>
var _hmt = _hmt || [];
(function() {
  var hm = document.createElement("script");
  hm.src = "https://hm.baidu.com/hm.js?2eb031e42d29b7c1a1f16948d2ae2a9f";
  var s = document.getElementsByTagName("script")[0]; 
  s.parentNode.insertBefore(hm, s);
})();
</script>
</footer>  
</div>
<script>
    $(function(){
                    $(".post-content").append('<p style="padding: 20px;color: #cacaca;">原文链接：https://www.cnblogs.com/xiaoyou2018/p/14037006.html</p>')  
            }) 
</script> 
</body>
</html>