【问题标题】:Aggregating dropwizard timer metrics聚合 dropwizard 计时器指标
【发布时间】:2016-05-13 08:01:33
【问题描述】:

我目前正在为我的应用程序开发监控系统,该系统由几个独立的微服务组成。我使用dropwizard-metrics 从 JVM 收集数据,InfluxDB 用于存储,Grafana 用于创建漂亮的图表。

我的目标之一是创建简单的仪表板,展示我的应用程序的执行情况。因此,我必须汇总每个微服务的指标才能获得全局视图。

一些指标很容易汇总,例如活动数据库连接的总和。我在聚合 timer metric 时遇到问题,我想以某种方式简单地可视化,例如我有兴趣从我的所有微服务实例中汇总我的应用程序所依赖的系统响应时间的百分位数。

我认为这是很常见的情况。你有什么建议吗?我已经阅读了blog post 的相关信息,但它并没有涵盖我的情况。

【问题讨论】:

    标签: java monitoring dropwizard influxdb grafana


    【解决方案1】:

    dropwizard 指标计时器已经进行了聚合。理想情况下,您需要在指标收集应用程序中不进行预聚合,除非绝对必要。您可以稍后在 Grafana 中进行聚合(百分位数等)。

    【讨论】:

      【解决方案2】:

      您可能只想购买一个 APM 工具,然后自己考虑构建、升级和维护所有这些工具的相关成本。还有与之相关的存储和计算。当您收集所有这些时,您还将在您的应用程序上引入开销。这听起来不像是解决问题的正确方法。最后,即使使用 dropwizard,您仍然需要监控前端和其他技术(服务器等)。这是你不应该自己做的主要原因。看看 AppDynamics、New Relic 或 Ruxit 作为现代选项,它们可以为您完成所有这些工作。

      【讨论】: