【问题标题】:Incorrect Google Cloud metrics? or what is going on?谷歌云指标不正确?或者发生了什么?
【发布时间】:2020-03-07 16:15:57
【问题描述】:

我的背景更多来自 Twitter 方面,所有的统计数据都是按分钟记录的,因此您每分钟可能有 120 个请求。在 Twitter 内部,有人提出了除以 60 的好主意,所以大多数图表(除了一些团队意识到除以 60 根本不是真正的 rps,因为在一分钟内,它会波动)。因此,许多图表每秒报告 2 个请求,而不是每分钟 120 个请求。在谷歌中,似乎他们在做同样的事情,除了数学没有显示出来。在 twitter 中,我们可以乘以 60,而答案总是在那一分钟内发生了多少请求的整数。

但是,在 Google 中,我们看到 0.02 个请求/秒,如果我们乘以 60,则为每分钟 1.2 个请求。如果它们是微小的粒度,那么他们肯定算错了,或者他们的数学有问题。

这是来自我们点击实例本身时的 cloudrun 指标

我在这里缺少什么?更好的是,我们可以按每分钟的请求报告吗?每秒请求实际上是那一分钟的平均请求/秒,当我们讨论如何获得 0.5 个请求/秒时,这可能会让人们感到困惑。

我假设这不是“在”分钟边界每秒的请求,因为这将很难计算,但也将是一个整数......即。 0 个请求或 1 个请求,而不是 0.2 个请求,老实说这毫无用处。

每个云运行实例都会创建此图表,所以我假设每个人都一样,但如果我点击“在指标资源管理器中查看”,则会给出这张图片,说明“谷歌如何配置它”......

【问题讨论】:

  • 能否向我们展示指标的完整定义?我的直觉是,计数的平均时间间隔超过一分钟(可能是 5 分钟)。例如,0.02/s 的值是 5 分钟间隔内的 6,因为这是一个整体,这似乎是有道理的。
  • @Kolban 好吧,每个 cloudrun 实例都创建了这个计数图表。我想出了如何在指标资源管理器中单击查看,它也提供了详细信息。它说对齐周期是 1 分钟,所以看起来还是很奇怪?

标签: metrics google-cloud-run google-cloud-metrics


【解决方案1】:

由于它在 Metrics from Cloud Run Documentation 上可用,请求计数指标每 60 秒采样一次,它不包括未到达容器实例的请求计数,给出的示例是未经授权的请求或在最大数量之后发送的请求达到了实例,这显然不是您的情况,但同样需要考虑。

假设请求计数的计算是错误的,我在Google's IssueTracker system 上对监控和云运行组件进行了一些挖掘,以检查是否有任何与此相关但找不到的错误打开,我会建议您在他们的系统中创建一个错误,以便 Google 可以解决它,并在修复后通知您。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-03-31
    • 2020-05-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-09-09
    相关资源
    最近更新 更多