假设我有一个数据帧如下,通过一或下一行循环,做计算 - 的Python
ID response time
1 1315 1.434054
2 1682 3.753334
2 2829 5.940094
3 184 6.243214
4 243 6.301918
3 1413 7.486633
5 2400 11.474644
6 2151 3.288531
数据帧有一个ID,响应和时间。
对于没有重复ID(1,4,5,6)的示例,我想返回时间。 对于在ID(2,3)中确实有重复的示例,我想返回min_time列中两次中的最小值和差异列中两次之间的差值。以下是我在看的输出,
ID response time min_time difference
1 1315 1.434054 1.434054 NA
2 1682 3.753334 3.753334 2.18676
2 2829 5.940094 3.753334 2.18676
3 184 6.243214 6.243214 1.243419
4 243 6.301918 6.301918 NA
3 1413 7.486633 6.243214 1.243419
5 2400 11.474644 11.474644 NA
6 2151 3.288531 3.288531 NA
虽然我能够把使用循环这个输出,它不是做最好的有效的方法,也需要花费大量的时间。有一个更好的方法吗?
也许这可以帮助:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html – moooeeeep