我想在数据框中应用滚动平均函数。我在数据框中有多个类别(列类别中的A和B),所以我必须计算每个类别的滚动平均值,这是我的问题。根据另一列的值在新数据帧列中应用函数
数据框如下所示。 Rolling_Mean列是预期结果。
Date Category Value Rolling_Mean
01.01.2017 A 12,30 NaN
02.01.2017 A 12,50 NaN
03.01.2017 A 12,90 12,57
04.01.2017 A 13,10 12,70
05.01.2017 A 12,90 12,74
06.01.2017 A 13,55 12,88
07.01.2017 A 13,12 12,91
01.01.2017 B 1,14 NaN
02.01.2017 B 1,52 NaN
03.01.2017 B 1,74 1,47
04.01.2017 B 2,12 1,63
05.01.2017 B 1,75 1,65
06.01.2017 B 1,69 1,66
07.01.2017 B 1,35 1,62
计算滚动平均值我用熊猫滚动:
df['Rolling_Mean'] = df['Value'].rolling (window=3).mean()
,但我不能够计算滚动平均值为多个类别。
我试图用numpy.where(下面)来计算这个,但它只适用于一个类别,我在寻找解决方案,它适用于10个类别。
df['Rolling_Mean'] = np.where((df.Category == 'A'), df['Value'].rolling(window=3).mean(), 0)
谢谢,它的工作原理! – bar1
很高兴能帮到你!美好的一天! – jezrael