【发布时间】:2020-09-06 21:17:58
【问题描述】:
我有:
带有我想比较的点对的RDD1
(2,5), (3,7), ...
和 RDD2 与每个点的尺寸
(0,List(5,7)), (1,List(2,4)), ...
如何获取第二个 rdd 的尺寸,以便比较第一个 rdd 的对?
(两个 rdd 都很大,我无法收集它们)
(join 不适用于不同的 rdd 架构)
https://www.mdpi.com/1999-4893/12/8/166/htm#B28-algorithms-12-00166
【问题讨论】:
-
您在寻找 Java 或 Scala 的解决方案吗?
-
我只在 Scala (spark) 中寻找解决方案
-
您希望在这些坐标上执行哪些类型的操作?让我们说如果他们是来自 df1 的 (x1,y1) 和 (x2,y2) 应该怎么办?例如x3 = x1-x2 和 y3 = y1-y2 是您要查找的输出吗?
-
每一对RDD1由两个不同点的id组成。如果我有 RDD1 的 (id1,id2) 和 RDD2 的 ((id1,(x1,y1))) 和 ((id2,(x2,y2))),我必须在这两个点 id1 和id2
标签: join compare rdd dimensions points