【发布时间】:2019-07-15 00:32:48
【问题描述】:
我在 Spark Scala 中有以下小型演示 DataFrame:
Type Description
0
1 Action 1
1 Drop: Action 1
2 Action2
我需要删除Description 列中包含“Drop”的所有行,同时保留Description 为空的行。
预期结果:
Type Description
0
1 Action 1
2 Action2
如果我运行下面显示的代码,我会得到这个输出(Description 为空的行被删除)。
Type Description
1 Action 1
2 Action2
我的代码:
df
.na.fill("Description", Seq("Error"))
.filter(!(col("Description").contains("Drop")))
.select(col("Type"),col("Description"))
.distinct
.sort(col("Type").asc)
.show()
【问题讨论】:
标签: scala apache-spark apache-spark-sql