1
我想根据从pandas.date_range生成的DatetimeIndex
对多指数DataFrame
做一些聚合。熊猫多元指数聚合
我DatetimeIndex
看起来是这样的:
DatetimeIndex(['2000-05-30', '2000-05-31', '2000-06-01' ... '2001-1-31'])
我的多指标DateFrame
看起来是这样的:
value
date id
2000-05-31 1 0
2 1
3 1
2000-06-30 2 1
3 0
4 0
2000-07-30 2 1
4 0
1 0
2002-09-30 1 1
3 1
中DatetimeIndex
日期可能会或可能不会在日期索引 。
我需要检索所有id
,以便value==1
的百分比大于或等于某个小数阈值,例如, 0.6
所有行,其中对于id
日期是在DatetimeIndex
。
例如,如果阈值是0.5
,则输出应该是[2, 3]
或一些DataFrame
含有2
和3
。
1
不符合要求,因为2002-09-30
不在DatetimeIndex
中。
我有循环和dictonaries的解决方案来跟踪多久value==1
每个ID,但它运行速度非常慢。
我怎样才能利用pandas
执行此聚集?
谢谢。
我想我的问题是有点不清楚,但我试图用一个均值> .6获得IDS在DATE_RANGE所有日期 – bphi
是的,你是对的。有些事情我不清楚。样本数据'rng = pd.date_range('2000-05-30','2000-7-01')和范围'0.5'的期望输出是什么? – jezrael
ID 1具有的0在DATE_RANGE日期的平均,平均(ID 2)= 1,平均(ID 3)= 0.5和平均(ID 4)= 0因此,如果阈值是0.5,则输出应该是' 2,3' – bphi