1
我有一个小样本,看起来像这样一个数据帧:子集叠熊猫据帧
Country Item mean_area
84 Albania Sunflower seed 1900
85 Albania Tangerines, mandarins, clementines, satsumas 0
86 Albania Tobacco, unmanufactured 5700
87 Albania Tomatoes 5400
88 Albania Vegetables, freshnes 0
89 Albania Vegetables, leguminousnes 20
90 Albania Vetches 6200
91 Albania Watermelons 8300
92 Algeria Wheat 112000
93 Algeria Almonds, with shell 27150
完整的数据帧是在这里:https://www.dropbox.com/s/b413htrn39m2wzg/zzzzz.csv?dl=0
我想根据总和来选择前10个国家mean_area(完整的数据帧有近200个国家),并选择前5作物为每个国家(再一次基于mean_area)
我可以根据mean_area的前10个国家如下:
df = (df_stacked
.loc[df_stacked['Country']
.isin(df_stacked.groupby('Country')
.sum()
.nlargest(10, 'mean_area').index)])
然后,我如何将它转换为每个国家只有前5位作物的数据框。