【发布时间】:2016-03-03 16:37:53
【问题描述】:
有没有一种有效的方法可以在RDD 中找到特定元素,然后将其删除?
例如:
sc.parallelize(Array(Array(4,2,6),Array(2,5),Array(1, 2, 3), Array(1, 2, 6)))
在 RDD 中找到具有特定值的 Array(1,2,3) 并将其删除,这可能吗
提前致谢
【问题讨论】:
-
我不明白,你应该解释一下。
-
我已经更正了我的问题。更一般地说,我想找到一个元素并从 rdd 中删除
-
从技术上讲,RDD 是不可变的,因此您无法从中删除任何内容。您可以根据没有元素的 RDD 创建一个新的 RDD。 @AlbertoBonsanto 已经回答了这个问题(除非您只想删除第一次出现的问题?)
标签: scala apache-spark rdd