【发布时间】:2015-12-16 08:15:29
【问题描述】:
我有一个 RDD,每个条目的格式为(Long,Array[Double])。例如:
val A = sc.parallelize( [(0, [5.0, 8.3]), (1, [4.2, 1.2])] )
我想将 A 转换为形式:
[(0, 0, 5.0), (0, 1, 8.3), (1, 0, 4.2), (1, 1, 1.2)],
元组中的第二个元素是数组中值的索引。
【问题讨论】:
标签: scala apache-spark rdd