【发布时间】:2020-12-25 02:28:27
【问题描述】:
我想在聚合一些超过 1 列的数据集后计算行数, 例如
val iWantToCount = someDataSet
.groupBy($"x", $"y")
.agg(count().as("Num_of_rows"))
但count 没有重载,它不接受任何参数。
我还有其他选择吗?
编辑:
count("*") 是正确的方法吗?
【问题讨论】:
-
count("1")怎么样? -
@GordonLinoff 我在另一个线程上读到,如果我使用
count(lit(1))就像写count($"x")这不是我想要的 -
不是完全相同的副本,但可能会有所帮助:behavior of count function inside agg
标签: sql scala apache-spark apache-spark-sql