0
这里是假的数据:怎么办时间差异上的每个组熊猫Python中
df = pd.DataFrame({'email': ['u1','u1','u1','u2','u2','u2'],
'timestamp': [3, 1, 5, 11, 15, 9]})
我打算检索是各组的电子邮件的时间差异。因此,每个组由时间戳排序后,数据应该是:
u1 5
u1 3
u1 1
u2 15
u2 11
u2 9
的结果应该是:
u1 2 # 5-3
u1 2 # 3-1
u2 4 # 15-11
u2 2 # 11-9
谁能告诉我,我下一步该做什么?万分感谢。
@MaxU该指数也更有意义。谢谢。 – ayhan
我们可以将索引(2,0,4,3)切换到上一个相应的电子邮件列吗?谢谢 – Judking
@Judking请参阅编辑。 – ayhan