2016-12-15 184 views
5

我 我想找出在DF所有的项目其不在DF1,在DF1也物品,但不是在DFPyspark“PipelinedRDD”对象有没有属性“秀”

df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9]) 
    df1=sc.parallelize([4 ,5 ,6,7,8,9,10]) 
    df2 = df.subtract(df1) 
    df2.show() 
    df3 = df1.subtract(df) 
    df3.show() 

只是想检查结果,看看我是否理解好功能。 但是得到这个错误 'PipelinedRDD'对象没有属性'显示' 任何建议?

回答

7
print(df2.take(10)) 

df.show()仅适用于火花数据帧

-1

它打印出来,这是一个RDD和类型是值的,因为我们可能expect.That的一个PipelinedRDD不是一个列表,因为我们还没有执行行动,但我们只进行了一次转变。

尝试这样做,

df3.count() 

那么你可以做

df3.show() 
+1

它不起作用,因为DF3是RDD,而不是一个数据帧。 – David

相关问题