【发布时间】:2019-11-14 11:55:39
【问题描述】:
火花 2.4.0
rdd = rdd.cache()
print(rdd.getStorageLevel())
内存序列化 1x 复制
sc.setCheckpointDir("/tmp/checkpoints")
rdd.checkpoint()
对 rdd 的操作
rdd.count()
25066
检查是否有检查点:
rdd.isCheckpointed()
错误
print(rdd.getCheckpointFile())
错误
【问题讨论】:
-
执行
isLocallyCheckpointed()会返回什么? -
@Bala 其返回 False
-
scala 代码对你有用吗?如果是这样,请添加该标签。我会写一个例子
-
this 能回答你的疑问吗?
-
基本上,你只需要
checkpointed_rdd = rdd.checkpoint()你的checkpointed_rdd.isCheckpointed()应该返回true
标签: apache-spark pyspark rdd