【发布时间】:2019-09-30 14:59:19
【问题描述】:
我正在使用 Prometheus 2.9.2 来监控大型节点环境。 作为在我们的环境中测试 Prometheus 最大规模的一部分,我在我们的测试环境中模拟了大量的指标。
我的管理服务器有 16GB 内存和 100GB 磁盘空间。
在规模测试期间,我注意到 Prometheus 进程消耗的内存越来越多,直到进程崩溃。
我注意到,当 Prometheus 的内存使用量上升时,WAL 目录被大量数据文件快速填满。
管理服务器每 15 秒刮一次其节点,存储参数全部设置为默认值。
我想知道为什么会发生这种情况,以及如何/是否可以防止进程崩溃。
谢谢!
【问题讨论】:
-
您可以通过抓取“/metrics”端点来监控您的 prometheus。我会给你有用的指标。
标签: memory prometheus