与数据替换丢失的数据I具有非regulirased数据在这样一分钟的间隔:熊猫 - 重新取样非正规化数据一个分钟间隔在3个小时的间隔和在一个时间范围
Date Vel Dir
14-11-2001 17:55:00 14.1 35
14-11-2001 17:56:00 10.4 52
14-11-2001 17:57:00 14.8 19
14-11-2001 18:04:00 11.4 54
14-11-2001 18:05:00 7.6 13
我想在,例如,如果在18小时和00分钟的数据缺失的方式来重新取样该数据为3小时(0,3,6,9,12,15,18,21)的间隔,我用在00分钟之后或之前五分钟范围内最近的数据替换它。在这个例子中,我的17 57的时间接近18比00 18 04,所以我用的17 57这样的数据替换数据丢失时间18 00:
14-11-2001 15:00:00 5.8 43
14-11-2001 18:00:00 14.8 19
14-11-2001 21:00:00 17.4 68
,如果我不
14-11-2001 15:00:00 5.8 43
14-11-2001 18:00:00 NaN NaN
14-11-2001 21:00:00 17.4 68
我试图与.resample做到这一点('3H:后或00分钟之前,我没有完成丢失的数据离开小时与南这样有五分钟的时间间隔数据')熊猫命令,但我不知道如何去做,用5分钟范围内最近的数据替换缺失的值。
我尝试使用np.searchshorted但我不能够建立与它五分钟范围内,所以我放弃这个想法。
我的代码现在的问题是很简单的,我只是读取数据的文本文件,并重新取样,在3个小时的间隔,不替换数据,所以我的数据是这样看的时候我解压,因为我的文本文件:
Date Vel Dir
14-11-2001 15:00:00 5.8 43
14-11-2001 18:00:00
14-11-2001 21:00:00 17.4 68
的代码是:
import numpy as np
import pandas as pd
dateparse = lambda x: pd.datetime.strptime(x,'%d %m %Y %H %M')
vento= pd.read_csv('vento.txt',header=0, delim_whitespace= True, parse_dates = [['Dia', 'Mes', 'Ano', 'Hora','Minuto']], index_col = 0, date_parser = dateparse)
vento_2=vento.resample('3H')
vento_2.to_csv(r'data.txt',index=True, index_label=None, sep='\t')