【发布时间】:2016-03-10 22:02:54
【问题描述】:
我使用 storageLevel = MEMORY_ONLY_SER_2 存储 RDD,以防万一一个执行器丢失,还有另一个数据副本。
然后我发现了一些奇怪的东西:
- 当我使用 storageLevel =
MEMORY_ONLY_SER(1xReplicated) 时,2xReplicated RDD 的 Size in Memory 似乎相同 - 即使我还有很多剩余的存储内存,缓存的分数也无法达到 100%。
我是否正确理解 storageLevel = MEMORY_ONLY_SER_2?为什么 2xReplicated 的 Size in Memory 没有 1xReplicated 的两倍?谢谢!
【问题讨论】:
标签: scala memory apache-spark persist