2016-11-20 156 views
0

我有一个大熊猫数据帧具有三重多指数的一些数据:如何计算多指标熊猫数据框中的平均值和SEM?

Antibody  Time Repeats   
Customer_Col1A2 0 1  0.657532 
        2  0.639933 
        3  0.975302 
       5 1  0.628196 
        2  0.663301 
        3  0.921025 
       10 1  0.665601 
        2  0.785324 
        3  0.697913 

我的问题是,什么是计算平均值的平均值和(样品)标准误差为这个数据的最佳方式(由时间点分组因此,对于0时间点的答案将是(0.657532+0.639933+0.975302)/3=0.757589对于普通和0.188750216为SD输出会是这个样子:?

Antibody  Time Average  sample SD 
Customer_Col1A2 0 0.757589 0.188750216 
       5 ....  .... 
       10 ....  .... 

在此先感谢

回答

2

您可以将通过多指标的通过指定level参数的水平,并使用DataFrame.mean()计算平均值和SD和DataFrame.std()方法相应:

df1.groupby(level=[0,1]).agg({'avg': 'mean', 'sd': 'std'}) 

enter image description here

+0

为我节省了大量的时间,谢谢! – CiaranWelsh