我正在使用熊猫来构造和处理数据。这是我的数据框:给定时间重采样时间序列
我想要做的时间序列数据的重采样,并有,每一个ID(这里命名为“3”),所有的比特率的分数,从开始到结束(beginning_time/时间结束)。例如,对于第一行,我希望拥有所有的秒数,从2016-07-08 02:17:42到2016-07-08 02:17:55,具有相同的比特率分数,并且具有相同的ID 。事情是这样的:
例如,给定:
df = pd.DataFrame(
{'Id' : ['CODI126640013.ts', 'CODI126622312.ts'],
'beginning_time':['2016-07-08 02:17:42', '2016-07-08 02:05:35'],
'end_time' :['2016-07-08 02:17:55', '2016-07-08 02:26:11'],
'bitrate': ['3750000', '3750000']})
这给:
而且我想为第一行:
同样的事情e后一行。 因此,客观是重新采样开始和结束时间之间的deltaTime,当然,比特率得分必须相同。
我想这样的代码:
df['new_beginning_time'] = pd.to_datetime(df['beginning_time'])
df.set_index('new_beginning_time').groupby('Id', group_keys=False).apply(lambda df: df.resample('S').ffill()).reset_index()
但在这种情况下,没有工作!有任何想法吗 ?非常感谢你 !