【发布时间】:2018-07-26 06:34:53
【问题描述】:
根据 stackoverflow 36421619 的一篇很好的帖子,Spark Streaming 中的 foreachRDD 已经进行了一些讨论。不过,我觉得在阅读散文时答案还不够清楚。所以这里...
我的问题是:
- 什么时候 foreachRDD ... 返回超过 1 个 RDD? N个批次的滑动窗口?
- 如果我们只是按批次进行处理,那么会声明一个 RDD,所以呢?
我注意到,最常见的用例似乎是持久化到外部存储。这似乎是大多数输出操作的指南。我不知何故错过了一些东西。
【问题讨论】:
标签: spark-streaming