【发布时间】:2016-05-19 09:04:55
【问题描述】:
在这里,我有一个有两个工作的应用程序。在第一份工作中,我想设置广播,例如设置广播变量“true”,访问执行程序中的广播。在第二份工作中,我想将广播变量设置为“false”。以及如何达到要求? 我的代码是:
val conf = new SparkConf()
val sc = new SparkContext(conf)
var setCapture = true
sc.broadcast(setCapture)
val file = lc.textFile("file" ,2)
val flatMap = file.flatMap(line => line.split(" ")).map(word => (word, 1)).reduceByKey(_ + _)
val report = counts.collect()
setCapture = false
sc.broadcast(setCapture)
val packageResult = sc.parallelize(report).filter(_._1 == "package")
packageResult.collect.foreach(println)
我想在
中访问广播变量“setCapture”org.apache.spark.scheduler.ResultTask,
org.apache.spark.rdd.HadoopRDD,
org.apache.spark.util.collection.ExternalAppendOnlyMap,
org.apache.spark.shuffle.hash.HashShuffleWriter.
我该怎么办?
【问题讨论】:
-
对不起,前面没有代码,
-
然后关闭上一篇
-
如何删除之前的。
-
你可以看到-> awesomescreenshot.com/06e5vshp21
标签: apache-spark task broadcast executor