【发布时间】:2022-08-19 12:48:39
【问题描述】:
我正在学习 spark 上的 groupBy 函数,我创建了一个包含 2 个分区的列表,然后使用 groupBy 来获取每个奇数和偶数。我发现如果我定义
val rdd = sc.makeRDD(List(1, 2, 3, 4),2)
val result = rdd.groupBy(_ % 2 )
结果将转到他们自己的分区。但是如果我定义
val result = rdd.groupBy(_ % 2 ==0)
结果变成了一个分区。有人可以解释为什么吗?
-
groupBy(_ % 2 ) 得到结果 0 或 1 ,groupby(_ % 2==0) 得到结果 true 或 false
标签: apache-spark