【发布时间】:2017-10-18 07:13:34
【问题描述】:
我读过一些文章,对 Spark 流、Storm 和 Flink 等流处理引擎的性能进行基准测试。在评估部分,标准是第 99 个百分位和吞吐量。例如,Apache Kafka 以每秒大约 100.000 个事件发送数据,这三个引擎充当流处理器,它们的性能使用 99% 延迟和吞吐量来描述。
谁能帮我澄清这两个标准?
【问题讨论】:
-
我将从阅读 en.wikipedia.org/wiki/Percentile 开始。它通常会澄清关于百分位数的歧义。
-
@YuvalItzchakov 我知道百分位数在统计中的含义,但我想知道它在流处理领域的含义。
-
你能把你正在阅读的文章推荐给我们吗?
-
@YuvalItzchakov 当然,ieeexplore.ieee.org/document/7530084
标签: streaming spark-streaming apache-storm apache-flink