【发布时间】:2017-06-05 07:30:46
【问题描述】:
我试过这个简单的例子
scala> rdd2.collect
res45: Array[Person] = Array(Person(Mary,28,New York), Person(Bill,17,Philadelphia), Person(Craig,34,Philadelphia), Person(Leah,26,Rochester))
scala> rdd3.collect
res44: Array[Person] = Array(Person(Mary,28,New York), Person(Bill,17,Philadelphia), Person(Craig,35,Philadelphia), Person(Leah,26,Rochester))
scala> rdd2.subtract(rdd3).collect
res46: Array[Person] = Array(Person(Mary,28,New York), Person(Leah,26,Rochester), Person(Bill,17,Philadelphia), Person(Craig,34,Philadelphia))
我希望 rdd2.subtract(rdd3).collect 只应该是 Person(Craig,34,Philadelphia) 但我的输出是 rdd2 有人可以解释一下吗?
【问题讨论】:
标签: apache-spark