我有一个数据帧:大熊猫由每个类别计算的计数和总和组
category num1 num2 mark
1 A 2 2 0
2 B 3 3 1
3 C 4 2 2
4 C 3 5 2
5 D 6 8 0
6 E 7 5 1
7 D 8 1 1
我想由标记来计算每个类别组的计数数目(作为列),如:
the counts:
catgory mark_0 mark_1 mark_2
A 1 0 0
B 0 1 0
C 0 0 2
D 0 2 0
E 0 1 0
另一个是由上述标记计算每个类别组的数目的总和(作为列),如:
the sum:
category numsum_0 numsum_1 numsum_2
A 2 0 0
B 0 3 0
C 0 0 7
D 0 14 0
E 0 7 0
,我的方法是:
df_z[df_z['mark']==0]['category'].value_counts()
df_z[df_z['mark']==0].groupby(['category'], sort=False).sum()
,但它是低效
我们可以改变 '男' 为0? –
当然,我只是更新了答案。 – bernie
如果这里有两个num列:num1和num2,我们可以通过指定的num1或num2来计算总和吗?? –