我有一个数据集,其中有员工进出时间。它看起来是这样的(注意每个员工的两个条目):在列中查找开始时间和结束时间
Employee Date Time
Emp1 1/1/16 06:00
Emp1 1/1/16 13:00
Emp2 1/1/16 09:00
Emp2 1/1/16 17:00
Emp3 1/1/16 11:00
Emp3 1/1/16 18:00
我想要得到的数据是这样的:
Employee Date Start End
Emp1 1/1/16 06:00 13:00
Emp2 1/1/16 09:00 17:00
Emp3 1/1/16 11:00 18:00
我想进入它的数据帧格式,以便我可以做一些计算。
目前我已经试过
df['start'] = np.where((df['employee']==df['employee']&df['date']==df['date']),df['time'].min())
我也试过:
df.groupby(['employee','date]['time'].max()
如何获得两列了一个吗?
我建议'Date'和'Time'合并成一个列'DateTime'。这将大大简化您的工作。 – burhan
如果我把日期和时间合并在一起,那么我会怎么做? – KeatonYoung
为什么不''df.groupby(['Employee','Date'])。agg([min,max])'? – Zero