我有一个数据框,它包含在特定时间范围内汇总的数据,'date'是其中一列。现在每天都有一组具有完全相同列的新数据添加到此聚合数据中。现在我想对这些汇总数据应用一个过滤器,这个帖子附加了新的每日数据,我只需要最近九个月的数据。自动提取python中最近9个月的数据
假设df_old是您的汇总数据,新数据是df_new。目前我是这样做的
#Append new data to old aggregated data with same columns
df_old=df_old.append(df_new)
df_old['date']=pd.to_datetime(df_old['date'])
max_date=max(df_old['date']
df_old['date_diff']=(max_date - df_old['date'])
##Considering a calender month has 30 days and three months have 31 days
df_old.loc[df_old.date_diff <=273]
现在我知道上面的方法涉及硬编码,效率不高。我很感激,如果有人可以帮助一些自动化的方式做到这一点。
感谢Vikash !! ....多数民众赞成我正在寻找....我想避免任何硬编码。 – user2906657
@ user2906657欢迎您:)如果符合预期,请勾选答案。谢谢 :) –