【问题标题】:How to sustrack values when keys are the same in pairRDDs?当对 RDD 中的键相同时,如何减去值?
【发布时间】:2018-08-23 17:05:52
【问题描述】:

我有两个pairRDDs(Int, BreezeDenseMatrix[Double]),我想要的是,当keys 相同时,它们的值是相同的。

例如当我有

RDD_1 : (1, BreezeMatrix_a)

RDD_2:(1, BreezeMatrix_b)

想要的结果:(1, BreezeMatrix_a-BreezeMatrix_b)

我尝试了join,但返回的是(Int, (BreezeMatrix_a, BreezeMatrix_b)),我不知道如何转换第二部分。我不明白是set 还是arrayspark 不清楚。 还有其他想法吗?

【问题讨论】:

    标签: scala apache-spark rdd keyvaluepair


    【解决方案1】:

    让join的结果为

    joinresult = (Int, (BreezeMatrix_a, BreezeMatrix_b))
    

    然后给

    actualresult = joinresult.map( a => (a._1,( a._2_1 - a._2_2)))
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-02-11
      • 2020-10-29
      • 2019-09-20
      • 1970-01-01
      • 2022-12-09
      • 1970-01-01
      • 2022-08-12
      • 1970-01-01
      相关资源
      最近更新 更多