我有以下数据框:如何过滤掉,并通过排组条目值
df =
ID GROUP_1 GROUP_2 GROUP_3 GRADE
1A AAA BBB AAA 5
1B BBB BBB CCC 4
1C AAA BBB BBB 4
我想指望有傲人的成绩5
,4
,行数..,1
为GROUP
每个唯一值。请注意,在第一行中,有两次出现AAA
,但是我算了一次。
对于给定数据集的预期输出如下:
GROUP GRADE_1 GRADE_2 GRADE_3 GRADE_4 GRADE_5
AAA 0 0 0 1 1
BBB 0 0 0 2 1
CCC 0 0 0 1 0
我有低于给定的代码,它工作正常,但不包括分组(groupby('GRADE')
)。我不知道如何按GRADE
对结果进行分组,并创建列GRADE_1
,GRADE_2
,...,GRADE_5
。
df.groupby('GRADE').filter(regex="^GROUP").stack().reset_index(level=1, drop=True).reset_index().drop_duplicates()[0].value_counts()