2017-06-19 46 views
1

我有这样的代码熊猫等同于“从x组中选择x”by x?

dfUsers = df.groupby('UserID').count() 

这给我回的用户ID加计数的列表。它适用于我需要的功能,但是想知道是否有更好的代码用于从用户多次出现的数据框中获取用户标识的唯一列表,而不是计数?

的SQL相当于将是:从数据帧GROUPBY用户ID

回答

4

使用unique选择用户名:

dfUsers = df['UserID'].unique() 

或者,你可以使用drop_duplicates它返回一个DataFrame

dfUsers = df['UserID'].drop_duplicates()