【发布时间】:2021-09-08 17:23:03
【问题描述】:
我有 2 个如下的 RDD
val rdd1 = spark.sparkContext.parallelize(Seq((123, List(("000000011119",20),("000000011120",30),("000000011121",50))),(234, List(("000000011119",20),("000000011120",30),("000000011121",50)))))
val rdd2 = spark.sparkContext.parallelize(Seq((123, List("000000011119","000000011120")),(234, List("000000011121","000000011120"))))
我想根据 rdd2 中的密钥对来执行 rdd1 中的值相加。
需要输出:
RDD[(123,50),(234,80)]
任何帮助将不胜感激。
【问题讨论】:
标签: scala apache-spark rdd