【发布时间】:2015-10-18 04:55:01
【问题描述】:
我有两个 RDD。
rdd1 =(字符串,字符串)
key1, value11
key2, value12
key3, value13
rdd2 =(字符串,字符串)
key2, value22
key3, value23
key4, value24
我需要用 rdd1 和 rdd2 的合并行形成另一个 RDD,输出应该如下所示:
key2, value12 ; value22
key3, value13 ; value23
所以,基本上就是取 rdd1 和 rdd2 的键的交集,然后加入它们的值。 ** 值应按顺序排列,即 value(rdd1) + value(rdd2),而不是相反。
【问题讨论】:
标签: scala apache-spark