【发布时间】:2018-03-21 16:55:59
【问题描述】:
我使用函数创建了 python 文件 (python_file.py),然后在同一范围内的 pyspark-shell 中将该函数作为 UDF 调用。代码如下
import python_file as outer
pyspark_func = udf(outer.my_funct, StringType())
df1 = df.select(pyspark_func(col('col1')))
结果
AttributeError: 'UserDefinedFunction' 对象没有属性 '_get_object_id' 错误。
谁能解释一下这个错误。还有其他方法吗?
【问题讨论】:
标签: python-2.7 apache-spark pyspark spark-dataframe attributeerror