【发布时间】:2017-02-13 02:38:29
【问题描述】:
假设我们有一个每 5 秒运行一次的 Spark 流式传输作业。这里我们有一个 foreachRDD 语句,我们在其中广播一个变量。问题是每个RDD的广播变量是否每次都广播,即使它没有改变?
其次基于某些条件说1小时后,如果我使用unpersist()更新这个广播变量(意味着引用数据结构,BC变量指向)然后重新广播这个BC变量,这也会被广播吗仅对所有工作人员一次或多次,即在每个 foreachRDD 循环中一次?
【问题讨论】: