2017-08-29 83 views

回答

1

的解决方案类似于Retrieve top n in each group of a DataFrame in pyspark这是pyspark

如果您在斯卡拉做的一样,那么它应该是如下

df.withColumn("rank", rank().over(Window.partitionBy("Dept_id").orderBy($"salary".desc))) 
    .filter($"rank" <= 3) 
    .drop("rank") 

我希望答案是有帮助的

+0

@Coder ,没有答案帮助你? –

+0

谢谢,这真的帮了我。 – Learner

+0

@Coder感谢您的接受。你也可以upvote当你将符合条件:) –

相关问题