我有这样的列一个数据帧:列出熊猫集团最常见的会员?
id lead_sponsor lead_sponsor_class
02837692 Janssen Research & Development, LLC Industry
02837679 Aarhus University Hospital Other
02837666 Universidad Autonoma de Ciudad Juarez Other
02837653 Universidad Autonoma de Madrid Other
02837640 Beirut Eye Specialist Hospital Other
我想找到最常见的主要发起者。我可以列出使用每个组的大小:
df.groupby(['lead_sponsor', 'lead_sponsor_class']).size()
,给了我这样的:
lead_sponsor lead_sponsor_class
307 Hospital of PLA Other 1
3E Therapeutics Corporation Industry 1
3M Industry 4
4SC AG Industry 8
5 Santé Other 1
但我怎么找到顶级的10种最常见的群体?如果我做的:
df.groupby(['lead_sponsor', 'lead_sponsor_class']).size().sort_values(ascending=False).head(10)
然后我得到一个错误:
AttributeError: 'Series' object has no attribute 'sort_values'
对我而言,您的解决方案也适用。 – jezrael