【发布时间】:2016-10-07 22:41:33
【问题描述】:
我们可以使用 window 来创建一个转换后的DStream,批量更大:
streamIDs.window(Duration(1000)).foreachRDD(rdd => println(rdd.distinct().count()))
有没有什么方法可以在滑动持续时间也作为参数的移动窗口中进行相同的操作?
【问题讨论】:
标签: python apache-spark pyspark spark-streaming