星火，斯卡拉 - 如何从每个组的两个列获得数据帧

Dept_id | name | salary 
1   A  10 
2   B  100 
1   D  100 
2   C  105 
1   N  103 
2   F  102 
1   K  90 
2   E  110

我想要的结果形式如下：

Dept_id | name | salary 
1   N  103 
1   D  100 
1   K  90 
2   E  110 
2   C  105 
2   F  102

在此先感谢:)。

2017-08-29 Learner

如果您在斯卡拉做的一样，那么它应该是如下

df.withColumn("rank", rank().over(Window.partitionBy("Dept_id").orderBy($"salary".desc))) 
    .filter($"rank" <= 3) 
    .drop("rank")

我希望答案是有帮助的

2017-08-29 07:42:03

@Coder ，没有答案帮助你？ –

谢谢，这真的帮了我。 – Learner

@Coder感谢您的接受。你也可以upvote当你将符合条件:) –

回答