【发布时间】:2018-06-01 18:57:13
【问题描述】:
我正在使用结构化流从 Kafka 读取数据并创建各种聚合指标。我已经使用metrics.properties 启用了 Graphite sink。我已经看到旧 Spark 版本中的应用程序具有流相关的指标。我没有看到与结构化流相关的流相关指标。我究竟做错了什么?
例如 - 无法找到未处理的批次或正在运行的批次或最后完成的批次总延迟。
我通过设置启用了流式指标:
SparkSession.builder().config("spark.sql.streaming.metricsEnabled",true)
即便如此,我也只获得了 3 个指标:
- driver.spark.streaming.inputrate
- driver.spark.streaming.latency
- driver.spark.streaming.processingrate
这些指标之间存在差距。而且它在应用程序启动后才开始出现。如何将广泛的流相关指标获取到 grafana?
我检查了StreamingQueryProgress。我们只能使用这个以编程方式创建自定义指标。有没有办法可以使用 Spark 流式传输已经发送到我提到的接收器的指标?
【问题讨论】:
标签: apache-spark apache-spark-sql graphite spark-structured-streaming