我有ID为科拉姆一个数据帧:S,可以包含重复:大熊猫重新映射到的范围列
>>> df['user_id'].head()
Out[3]:
0 2134
1 1234
2 4323
3 25434
4 1234
Name: user_id, dtype: int64
我怎样才能重新映射这使用户ID的从任意数量的推移及以上,按原始数量递增?在这个例子中这将是下面,从2:
>>> df['user_id'].head()
Out[3]:
0 3
1 2
2 4
3 5
4 2
Name: user_id, dtype: int64
很酷!如果我不关心索引或保存旧的ID,只需要这样做,对吧? df1 ['user_id'] = pd.factorize(df1 ['user_id'])[0] – user1506145
@ user1506145确定或调用'reset_index(drop = True)'使索引再次从'0'开始 – EdChum