【发布时间】:2018-09-09 22:17:59
【问题描述】:
我对 Spark Scala 有疑问,我想从 dstream 数据中计算平均值,我像这样从 kafka 获取数据到 dstream,
[(2,110),(2,130),(2,120),(3,200),(3,206),(3,206),(4,150),(4,160),(4,170)]
我想这样数他们,
[(2,(110+130+120)/3),(3,(200+206+206)/3),(4,(150+160+170)/3)]
那么,得到这样的结果,
[(2,120),(3,204),(4,160)]
如何使用 dstream 中的 scala 执行此操作?我使用火花版本 1.6
【问题讨论】:
标签: apache-spark spark-streaming