【发布时间】:2020-06-18 20:29:09
【问题描述】:
所以Dataframe.where 可用于过滤由表达式给出的行的数据框,如下所示:
df.where(($"group_id" == 1234) || ($"group_id" == 4434))
或者举个更复杂的例子
df.where(($"group_id" == 1234 && $"country" === "PL") || ($"group_id" == 4434 $"country" === "FR"))
我对是否可以以某种方式提供这些条件作为列表感兴趣,所以假设我有一个 group_id 的列表,List((1234, "PL"), (4434, "FR"), ....) 然后我想有效地过滤数据框。
【问题讨论】:
标签: scala dataframe apache-spark