2017-02-13 40 views
0

我一直在努力,现在这个问题了几个小时,并不能似乎找到了解决方案,使IM希望somobody能帮助我。同名熊猫/ Python的组对象和他们的意思

林希望找到一个平均响应时间在我的城市的每个救护基地。我已经将数据帧缩小到“站”和“响应时间”了,现在我试图找到每个站的平均响应时间。这里是我的数据框的前4个值。

Station  Response 
Tara Street  4 
Finglas   6 
Tara Street  7 
Central   3 
Tara Street  4 

现在什么即时希望做的是计算出各站的平均响应时间和排序他们说的时间。因此,它看起来像这样

Station  Response 

Finglas   6 
Tara Street  5 
Central   3 

任何帮助,将不胜感激

+0

请仔细阅读http://stackoverflow.com/help/how-to-ask。向我们展示代码和不工作的内容。 –

回答

0

您需要groupbysort_values

#first try cast to int, if error, try to_numeric 
df.Response = df.Response.astype(int) 

#castvalues to int or floats, if some non numeric replace them by NaN 
#df.Response = pd.to_numeric(df.Response, errors='coerce') 

df = df.groupby('Station')['Response'].mean().sort_values(ascending=False).reset_index() 
print (df) 
     Station Response 
0  Finglas   6 
1 Tara Street   5 
2  Central   3 
+0

谢谢您的回答,我已经尝试过了,我得到以下错误 DataError:没有数字类型聚集 我试图 DF [“回应”]申请(INT) 并返回: “名称:响应,D型:Int64' 的 –

+0

请检查编辑答案。 – jezrael

+0

非常感谢你工作像魅力:) –

0

可以使用groupby用于聚集catgories

df.groupby('Station').mean().sort_values('Response', ascending=False)