【发布时间】:2017-04-02 19:11:40
【问题描述】:
这是一个非常简单的问题:在 spark 中,broadcast 可以用来高效地将变量发送给执行器。这是如何工作的?
更准确地说:
- 什么时候发送值:只要我打电话给
broadcast,或者什么时候使用这些值? - 数据到底发送到了哪里:发送给所有执行者,还是只发送给需要它的人?
- 数据存储在哪里?在内存中,还是在磁盘上?
- 简单变量和广播变量的访问方式有区别吗?当我调用
.value方法时,底层会发生什么?
【问题讨论】:
标签: apache-spark hadoop2 bigdata