【发布时间】:2016-05-11 09:45:09
【问题描述】:
假设我有以下列表和一个值:
alist = [1,2,3,4,5]
alistRDD = sc.parallelize(alist)
single_value = 3
我得到了以下功能:
def a_fun(x,y):
return x+y
我正在做以下事情:
alistRDD.map(lambda x:a_fun(x,single_value))
所以我将此函数用作第二个参数single_value。广播这个single_value 以便在所有节点中有意义吗?
【问题讨论】:
-
我认为您的问题更多:在性能方面重要吗?我认为答案是否定的
标签: apache-spark pyspark broadcast