【问题标题】:Some Ignite metrics not updating一些 Ignite 指标未更新
【发布时间】:2023-12-29 14:44:01
【问题描述】:

我有一个 Apache Ignite 集群,它公开指标(来自缓存和节点)

指标使用 Ignite 的标准更新时间进行更新,然后每 5 秒一次,我在 Prometheus 中收集这些指标。

实际情况是,其中一些指标总是显示 0 值,而另一些则显示有意义的值。 这是一个例子:

cpu usage and cache size

在这里,在左图中,我查询 avg(ignite_average_cpu_load)avg(ignite_current_gc_cpu_load) 第一个正确显示,而第二个总是报告 0(注意:如果发生错误并且 Prometheys 没有收集任何内容,则显示空值,因此 Ignite 本身给了我该值)

在右图中更明显:我在截屏时每秒插入约 25k 缓存条目。但没有显示时间。

我用cacheConfiguration.setStatisticsEnabled(true) 激活了缓存配置中的指标(在ignition.start() 之前),然后我用

val clusterMetrics = ignite.cluster().forLocal().metrics()

val cacheMetrics = cache.localMetrics()

调用 cache.put 的节点与存储缓存本身的节点不同。 任何其他设置都保留为默认值。我的采集服务每 5 秒滴答一次。

可能是什么问题?

【问题讨论】:

    标签: java scala metrics ignite prometheus


    【解决方案1】:

    有一张打破平均计时指标的票:https://issues.apache.org/jira/browse/IGNITE-3495

    我想,你也遇到过同样的问题。

    对于当前的 GC CPU 指标,之前没有注意到显示不足的值。也许它总是接近 0?

    你执行的平均是多少?也许它使结果值始终接近 0?

    【讨论】: