【发布时间】:2018-10-30 14:05:35
【问题描述】:
我不明白窗口进程中的状态。例如;
val sums = levels.
groupBy(window($"time", "5 seconds")).
agg(sum("level")).show()
- 根据上面的代码,Spark 是否只保留最后 5 秒的状态?
- 是否在每个窗口操作中删除旧状态?
- 窗口状态在哪里举行?记忆?
并且,通过水印,是否在每个分组操作中删除旧状态?
【问题讨论】:
标签: apache-spark spark-structured-streaming