【发布时间】:2021-08-26 14:57:30
【问题描述】:
根据Prometheus documentation the increase() function 应该考虑重置。
会自动调整单调性中断(例如由于目标重新启动而导致的计数器重置)。
但是,我观察到一个似乎与此相矛盾的案例。
如果我查看 sum(maf_http_req_time_sum) 的生命周期图,我发现它在计数器重置之前达到了 741 的峰值。
重置后是87的新高峰。
这个计数器的总生命周期增加应该超过 800。
但是,如果我尝试查找此计数器在过去 7 天(在创建计数器之前)的增量,我只会看到 437 的增量:
sum(increase(maf_http_req_time_sum[7d])) 应该返回一个大于 800 的值。
查询sum(increase(maf_http_req_time_sum[7d]))有什么问题吗?
编辑:
我在这里唯一能想到的可能是maf_http_req_time_sum 在技术上不是一个计数器。它是我创建的名为maf_http_req_time 的直方图的_sum 组件。
我找不到任何关于 maf_http_req_time_sum 是什么类型的指标的文档,当我点击以下网址时,maf_http_req_time_sum 根本没有列出:/api/v1/targets/metadata
【问题讨论】:
-
这可能与 Prometheus 在
increase()函数中使用的外推有关。见github.com/prometheus/prometheus/issues/3746。顺便说一句,您能否在与 VictoriaMetrics 相同的数据集上尝试此查询?它使用来自 MetricsQL 的increase()函数中的精确计算。还有increase_pure()功能。
标签: prometheus grafana