【发布时间】:2018-08-23 17:05:52
【问题描述】:
我有两个pairRDDs(Int, BreezeDenseMatrix[Double]),我想要的是,当keys 相同时,它们的值是相同的。
例如当我有
RDD_1 : (1, BreezeMatrix_a)
RDD_2:(1, BreezeMatrix_b)
想要的结果:(1, BreezeMatrix_a-BreezeMatrix_b)
我尝试了join,但返回的是(Int, (BreezeMatrix_a, BreezeMatrix_b)),我不知道如何转换第二部分。我不明白是set 还是array,spark 不清楚。
还有其他想法吗?
【问题讨论】:
标签: scala apache-spark rdd keyvaluepair