【发布时间】:2021-12-15 16:57:42
【问题描述】:
假设我有这张桌子
user | variable
1 | 2
1 | 3
2 | 4
我有以下 pyspark 查询
df.groupby("user").agg(F.udf(lambda x: 2 in x)(F.collect_list("variable")))
你知道这在 SQL 中的等价物是什么吗?
【问题讨论】:
-
pyspark 代码做什么/返回?
-
如果你解释了想要的结果,提供一个等价物应该很容易。