【问题标题】:Kubernetes prometheus metrics for running pods and nodes?运行 Pod 和节点的 Kubernetes prometheus 指标?
【发布时间】:2016-09-06 13:04:41
【问题描述】:

我已经设置了 prometheus 来监控 kubernetes 指标,关注 prometheus documentation

许多有用的指标现在出现在 prometheus 中。

但是,我看不到任何参考我的 pod 或节点状态的指标。

理想情况下 - 我希望能够绘制 pod 状态(Running、Pending、CrashLoopBackOff、Error)和节点(NodeReady、Ready)。

这个指标在任何地方吗?如果没有,我可以在某处添加它吗?怎么做?

【问题讨论】:

    标签: kubernetes metrics prometheus


    【解决方案1】:

    常规 kubernetes 设置不会公开这些指标 - 进一步讨论 here

    但是,可以使用另一个服务来收集这些集群级别的指标:https://github.com/kubernetes/kube-state-metrics

    这目前提供了 node_status_ready 和 pod_container_restarts 听起来像我想要的。

    【讨论】:

      【解决方案2】:

      我认为不存在这样的指标。

      您必须修改源代码才能添加它们。查看此文件,了解如何注册指标:https://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/metrics/metrics.go, 并查看有关如何记录指标的这一行:https://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/pleg/generic.go#L180

      【讨论】:

        【解决方案3】:

        我发现我可以使用 heapster 和 snap 来监控这些指标,这对于我的案例来说是一个可行的解决方法。让我知道你是否也在使用它,我会给你适当的指标来获取这些数据。

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 1970-01-01
          • 2021-12-23
          • 2016-08-03
          • 2020-03-17
          • 2021-02-12
          • 2018-09-02
          • 2020-04-10
          • 2016-08-09
          相关资源
          最近更新 更多