【发布时间】:2019-01-29 15:23:29
【问题描述】:
我必须执行火花流处理的基准测试。我的进程从 kafka 中获取消息,处理并加载到 ElasticSearch 中。上游每秒生成 100k 条记录。所以我想计算1秒内处理了多少条消息和延迟时间。是否有任何工具可用于监控这一点,或者是否有任何过程来计算这一点。
【问题讨论】:
-
你可以查看你工作的 spark ui。很详细。
-
当您说“基准”时,您希望获得哪些指标?
-
我想要每秒处理多少条消息
-
正如@z-star 所说,UI 有该信息。让作业运行足够长的时间来观察进程的长期行为。
标签: apache-spark apache-kafka spark-streaming