从数据框类似如下:填写大熊猫多指数的差距开始和结束时间戳
value fill
start end
2016-07-15 00:46:11 2016-07-19 03:35:34 1 a
2016-08-21 07:55:31 2016-08-22 18:24:49 2 b
2016-09-26 03:09:12 2016-09-26 06:06:12 3 c
我正在寻找一种方式来添加行填补国内空白,每个新行采取的fill
列作为其新的value
现有的相邻行。
在前面的例子的输出然后将:
value
start end
2016-07-15 00:46:11 2016-07-19 03:35:34 1
2016-07-19 03:35:34 2016-08-21 07:55:31 a
2016-08-21 07:55:31 2016-08-22 18:24:49 2
2016-08-22 18:24:49 2016-09-26 03:09:12 b
2016-09-26 03:09:12 2016-09-26 06:06:12 3
向量化方法,避免遍历纯Python数据帧,将重优选作为我必须处理大量的行。
你尝试'df.stack()'? – MaxU