我基本上想要从数据框中删除重复项,并将列中的最低值保留在由两列(名称和集群)分组的列中。举例来说,在这里,如果我的数据框:groupby并删除r数据框中的最低值
Name cluster score
19 Steve a1 30
51 Steve a2 30
83 Steve a2 -28
93 Steve a2 -38
115 Bob a4 30
147 Bob a5 -8
179 Bob a5 30
在大熊猫和SQL这将是一个GROUPBY做,但我竭力要弄清楚在R和真的连上手。我试着做一个双重名称和集群。第一个groupby是Name,然后是cluster。所以既然有三个'史蒂夫,a2'我只想保留最低分的那个。
我的期望的输出将是以下:
Name cluster score
19 Steve a1 30
93 Steve a2 -38
115 Bob a4 30
147 Bob a5 -8
任何帮助,将不胜感激