【发布时间】:2018-09-08 21:51:19
【问题描述】:
如何将RDD[(Int,Int)] 转换为RDD[Array[(Int,Int)]],在其中我将元素与其键组合在一起。
让我们说
(0,0),(1,0),(1,1),(0,1)
我希望它是一个数组 arr1 = ((0,0),(1,0)) 和一个 arr2 ((1,1),(0,1)) 所以生成的 rdd 将 arr1,arr2 作为数组。
【问题讨论】:
-
rdd.groupBy(_._1).mapValues(_.toArray)应该让你非常接近。 -
谢谢它的工作。如果你把它作为一个答案,我会选择它。
标签: scala apache-spark spark-streaming