2016-09-27 84 views
0

我有一个熊猫DataFrame,我正在做一个groupby(['target'])。count()。这工作正常。然而,对于每个组,我想要的一件事是ID列中唯一元素的数量。如何删除重复项,但保留第一个实例和空白单元格中的重复项在熊猫?

我想要做的是,对于ID列,除了任何ID值的第一个副本(ID对于组是唯一的,因此我不必担心这个问题),将其全部清空。然后,groupby()。count()会给我每个组中唯一ID的数量......但我不知道该怎么做。

+5

或者你可以使用['.nunique()'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.nunique.html)。 –

+0

这给了我作为一个整体独特的事物的数量。不是每个组。我需要每组 –

+2

nunique也定义在groupby对象上。你可以做'df.groupby('target')['ID']。nunique()' – ayhan

回答