【发布时间】:2017-04-17 10:41:11
【问题描述】:
我正在尝试做这样的事情
文件 = sc.textFile('mytextfile') 定义我的函数(我的字符串): 新值 = 我的字符串 对于我在 file.toLocalIterator() 如果我在我的字符串中: 新值 = 我 返回新值; rdd_row = some_data_frame.map(lambda u: Row(myfunction(u.column_name)))但是我得到了这个错误
您似乎正试图从广播变量、操作或转换中引用 SparkContext。 SparkContext 只能用在驱动程序上,不能用在它在工作人员上运行的代码中
【问题讨论】:
-
如果你能解释你想要达到的目标会更好,然后你也可以尝试提供帮助。
-
我有一个文本文件,它实际上是一个黑名单,我有一个数据框,其中有一列包含 url。我想解析每个网址并检查它是否在黑名单中。如果是,我将替换该值,否则我将保持相同的值。
标签: python-2.7 apache-spark pyspark