比方说,我有一个数据帧是这样的:熊猫:添加行到每一组视病情
date id val
0 2017-01-01 1 10
1 2019-01-01 1 20
2 2017-01-01 2 50
我想这组数据集由id
。
对于每个组,我想添加一个新的行,日期从现在开始为1年。如果它晚于组中的最后一个日期,则只应添加此行。行的val应该与组中的最后一行相同。
决赛桌应该是这样的:
date id val
0 2017-01-01 1 10
1 2019-01-01 1 20
2 2017-01-01 2 50
3 2018-09-25 2 50 <-- new row
当前的代码如下。我可以得到一个掩码,显示哪些组需要添加一行,但不知道下一步该怎么做。
>>> df = pd.DataFrame(data={'d': [datetime.date(2017, 1, 1), datetime.date(2019,1,1), datetime.date(2017,1,1)], 'id': [1,1,2], 'val': [10,20,50]})
>>> df = df.sort_values(by='d')
>>> future_date = (pd.datetime.now().date() + pd.DateOffset(years=1)).date()
>>> maxd = df.groupby('id')['d'].max()
>>> maxd < future_date
id
1 False
2 True
Name: d, dtype: bool