【发布时间】:2018-02-27 02:41:59
【问题描述】:
我已将 PagerBot https://github.com/stripe-contrib/pagerbot 部署到我们的内部 k8s 集群作为学习机会。我为它写了一个舵图很开心!
机器人似乎在未知时间断开了松弛,并且从未重新连接。我杀死了 pod,部署重新创建它并再次连接(我们使用的是 Slack RTM 选项)。
Pod 在断开连接时会记录以下条目:
2018-02-24 02:31:14.382590 I [9:34765020] PagerBot::SlackRTMAdapter -- Closed connection to chat. --
我想学习一种监视此日志条目并采取措施的方法。最初,我认为 Liveness 探测将是使用在记录此条目时返回非零的命令的方法。但是日志没有存储在容器内部(我可以看到)。
您如何根据可以使用kubectl logs pod-name 看到的日志来监控和采取行动?
我可以在我们的 Prometheus 测试部署中实现这一点吗?我应该使用已知的 k8s 功能吗?
【问题讨论】:
标签: kubernetes prometheus