【发布时间】:2017-11-12 07:26:35
【问题描述】:
我在 Scala 中工作,以便在独立机器(装有 Windows 10 的 PC)上使用 Spark 进行编程。我是新手,没有 scala 和 spark 编程经验。因此,我将非常感谢您的帮助。
问题:
我有一个 HashMap,hMap1,它的值是整数条目 (HashMap>) 的 HashSet。然后我将其值(即许多 HashSet 值)存储在 RDD 中。代码如下
val rdd1 = sc.parallelize(Seq(hMap1.values()))
现在我有另一个相同类型的 HashMap,hMap2,即 HashMap>。它的值也存储在 RDD 中
val rdd2 = sc.parallelize(Seq(hMap2.values()))
我想知道如何让 hMap1 和 hMap2 的值相交
例如:
输入:
rdd1 = [2, 3], [1, 109], [88, 17]中的数据
和rdd2 = [2, 3], [1, 109], [5,45]中的数据
输出
所以输出 = [2, 3], [1, 109]
【问题讨论】:
标签: scala apache-spark hashmap intersection hashset