【发布时间】:2018-11-14 00:40:44
【问题描述】:
我有一个 spark 数据框列“id”和“articles”以及一个值列表“a_list”,如下所示。
df = spark.createDataFrame([(1, 4), (2, 3), (5, 6)], ("id", "articles"))
a_list = [1, 4, 6]
我正在尝试将列表值与数据框列“文章”的值进行比较,如果发现匹配,则将列“E”更新为 1,否则为 0
我在下面的代码中使用“isin”
df['E'] = df.articles.isin(a_list).astype(int)
得到
TypeError:意外类型:
<type 'type'>
我在这里错过了什么?
【问题讨论】:
标签: python python-3.x pyspark