RDD减这么想的工作,我想这个简单的例子用户定义类型
scala> rdd2.collect
res45: Array[Person] = Array(Person(Mary,28,New York), Person(Bill,17,Philadelphia), Person(Craig,34,Philadelphia), Person(Leah,26,Rochester))
scala> rdd3.collect
res44: Array[Person] = Array(Person(Mary,28,New York), Person(Bill,17,Philadelphia), Person(Craig,35,Philadelphia), Person(Leah,26,Rochester))
scala> rdd2.subtract(rdd3).collect
res46: Array[Person] = Array(Person(Mary,28,New York), Person(Leah,26,Rochester), Person(Bill,17,Philadelphia), Person(Craig,34,Philadelphia))
我希望rdd2.subtract(rdd3).collect
只应该是Person(Craig,34,Philadelphia)
但我得到RDD2作为我的输出任何人都可以请解释一下吗?
谢谢你的回答,它在我的情况下效果很好。但如何使用粘贴模式可以解决问题? –
解决方案需要将案例类置于一个包中(本例中为mytest)。要做到这一点,我们需要粘贴模式。与原始选项。 –