我的数据框中有2列:x和y。 x在1-4之间不断重复,我需要找出关于x = 2的部分的一些统计数据,例如中点和平均等我已经创建使用.shift(-1)的第三柱:根据一列中值的重复顺序将熊猫数据帧分组到组中
df['x_shift']=df['x'].shift(-1)
x y x_shift
1 25 1
1 25 1
1 25 2
2 25 2
2 45 2
2 90 3
3 90 3
3 90 3
3 90 4
4 60 4
4 40 1
1 25 1
1 25 1
1 25 2
2 43 2
2 66 2
2 77 2
2 90 3
3 90
利用这一点,我已确定的点,其中x从1变为2和2至3以标记在那里我需要的数据的开始和结束:
start point = df.ix[(df['x']==2) & (df['x_shift']==2)]
final point = df.ix[df['x']==2) & (df['x_shift']==3)]
我试图创建组,生成统计数据,但我不知道如何GROUPBY内包括上述:
grouped = df.groupby( )
的意图是使用gr ouped.describe()生成统计数据,我希望我也能够提取和绘图?
我们可以肯定的是,模式是单调? –
我现在正处于一个使用熊猫群功能的阶段,我想在11122223333444411112222333444连续系列中将2222的每个部分分组,然后使用grouped.describe()给出每个部分的统计信息部分2222.有没有人有关于如何将所有这些分开的2222部分组合在一起的任何想法? – AM94