我有一个数据帧,我想在每个记录中使用唯一的id(rec_id)。 喜欢的东西如何在Python数据框中创建唯一的记录ID
我一直experiementing与·REC_ID = df.index,但指数不是唯一的 试过用df.reset_index复位()。 也不好。
任何建议受到热烈欢迎。
BR拉塞
我有一个数据帧,我想在每个记录中使用唯一的id(rec_id)。 喜欢的东西如何在Python数据框中创建唯一的记录ID
我一直experiementing与·REC_ID = df.index,但指数不是唯一的 试过用df.reset_index复位()。 也不好。
任何建议受到热烈欢迎。
BR拉塞
也许这样的事情
import pandas as pd
data = {'name': ['Jova', 'Mimi', 'Taty', 'Jessica', 'Alex'],
'year': [2012, 2012, 2013, 2014, 2014],
'docs': [40, 24, 19, 2, 3]}
df = pd.DataFrame(data, index = ['bg', 'ny', 'sd', 'sp', 'la'])
print (df)
print (df.name.unique())
我缺少一个漂亮的解决方案来解决它像这样。
colle=ds.columns
ds=ds.values
ds=pd.DataFrame(ds)
ds.columns=colle
ds['rec_id']=ds.index
试试这个:
ds = ds.assign(rec_id=np.arange(len(ds))).reset_index(drop=True)