【发布时间】:2020-08-13 21:13:44
【问题描述】:
所以,我想在我的数据框中创建一个新列,其行取决于两列中的值,并且还涉及一个条件。
我试过了,但它不起作用。
some_value = ...
df = df.withColumn("new_col", col("col1") if col("col2") == some_value else None)
这样做的正确方法是什么?
【问题讨论】:
-
你可以看看
when和otherwise,如果没有帮助,请创建一个可测试的例子 -
或 expr 是可能的。
标签: python dataframe apache-spark pyspark apache-spark-sql