【发布时间】:2016-07-11 23:25:23
【问题描述】:
在这一行中,哪个 RDD 被持久化了? dropResultsN 还是 dataSetN?
dropResultsN = dataSetN.map(s -> standin.call(s)).persist(StorageLevel.MEMORY_ONLY());
问题是来自Apache Spark timing forEach operation on JavaRDD 的一个附带问题,我仍在为如何最好地安排 RDD 创建时间这一核心问题寻找一个好的答案。
【问题讨论】:
标签: java scala apache-spark rdd timing