2017-08-13 78 views
0

groupby对象的长度与groupby对象的索引长度之间的区别是什么?我希望为这两个报表返回相同的数字。groupby及其索引的计数差异

len(Fees.groupby(['InstituteCode','Code','ProgramType','Status','AcademicYear'])) 
8000 

为什么我会得到不同的数字?

len(Fees.groupby(['InstituteCode','Code','ProgramType','Status','AcademicYear']).indices) 
7433 

这是否意味着对于给定的列列表,我只有7433个不同的记录?

回答

0

这是因为对于568条记录,“代码”列为null。那些被groupby跳过。当我使用...检查空值时变得清楚...

df.apply(lambda x: x.isnull().sum())