【发布时间】:2019-09-12 17:41:12
【问题描述】:
我有一个名为 root 的列,需要根据根列的不同值过滤数据框。
假设我在 root 中有一个值是父、子或子子,我想通过变量动态应用这些过滤器。
val x = ("parent,child,sub-child").split(",")
x.map(eachvalue <- {
var df1 = df.filter(col("root").contains(eachvalue))
}
但是当我这样做时,它总是会覆盖 DF1,我想应用所有 3 个过滤器并获得结果。
将来我可能会将列表扩展到任意数量的过滤器值,并且代码应该可以工作。
谢谢, 呸
【问题讨论】:
-
根列的类型是什么?
标签: scala apache-spark