【发布时间】:2017-10-07 01:45:13
【问题描述】:
我不确定 type 是否适合在这里使用,但是假设我有一个以下类型的 RDD
RDD[(Long, Array[(Long, Double)])]
现在,如果我有 RDD,我如何在运行时找到它的类型(如上所述)?
我基本上想在运行时比较两个 RDD,看看它们是否存储相同类型的数据(它本身的值可能不同),还有其他方法吗?此外,我想使用以下代码获取缓存的 RDD 作为 RDD 类型的实例
sc.getPersistentRDDs(0).asInstanceOf[RDD[(Long, Array[(Long, Double)])]]
其中 RDD[(Long, Array[(Long, Double)])] 是在运行时基于另一个相同类型的 RDD 动态发现的。 那么有没有办法在运行时从 RDD 获取这个值?
【问题讨论】:
标签: scala apache-spark rdd