【发布时间】:2020-11-27 03:57:55
【问题描述】:
我有 2 个 pyspark 数据框,我想检查一列的值是否存在于另一个数据框的列中。
我只看到了如何过滤存在的值的解决方案(like this),我需要做的是返回一个真或假的列。
在 pandas 中会是这样的:
df_A["column1"].isin(df_B["column1"])
提前致谢!
【问题讨论】:
标签: python dataframe apache-spark pyspark apache-spark-sql