如何访问数据框上的滚动窗口中的单个元素

我有一个数据框，以美国季度GDP作为列值。我想一次查看3个值，并找出GDP连续两个季度下降的指数。这意味着我需要将df ['GDP']内的各个元素相互进行比较，分组为3.如何访问数据框上的滚动窗口中的单个元素

下面是一个示例数据框。

df = pd.DataFrame(data=np.random.randint(0,10,10), columns=['GDP']) 
df 

    GDP 
0 4 
1 4 
2 4 
3 1 
4 4 
5 4 
6 8 
7 2 
8 3 
9 9

我使用df.rolling().apply(find_recession)，但我不知道我怎么可以在我的find_recession()函数内访问滚动窗口的各个元素。

gdp['Recession_rolling'] = gdp['GDP'].rolling(window=3).apply(find_recession_start)

如何才能获得滚动窗口内的各个元素，所以我可以作出gdp_val_2 < gdp_val_1 < gdp_val这样的比较？。

的.rolling（）申请（）将经过整个数据帧，3个值的时间，让我们来看看一个特定的窗口，它开始于索引位置6：

GDP 
6 8 # <- gdp_val 
7 2 # <- gdp_val_1 
8 3 # <- gdp_val_2

我如何在当前窗口中访问gdp_val，gdp_val_1和gdp_val_2？

来源

2016-11-18 Codedorf

你的问题还不清楚。一小部分数据和预期结果将会有所帮助。请阅读[MCVE]（http://stackoverflow.com/help/mcve）。 – Kartik

[The docs]（http://pandas.pydata.org/pandas-docs/stable/generated/pandas.core.window.Rolling.apply.html#pandas.core.window.Rolling.apply）表示该函数'''必须从ndarray输入中产生一个值...''。所以你只需将*索引到*它。我想这是通过的第一个位置参数。编写一个虚函数来打印它传递的内容。 – wwii

尝试'''numpy.all（a [1：] wwii

简短的回答是：你不能，但你可以使用你对数据框/系列结构的知识。

你知道该窗口的大小，你知道现在的指数 - 因此，您可以输出相对于当前指数的变化：

让我们假设，这里是你的国内生产总值：

In [627]: gdp 
Out[627]: 
0 8 
1 0 
2 0 
3 4 
4 0 
5 3 
6 6 
7 2 
8 5 
9 5 
dtype: int64

天真的办法就是返回(argmin() - 2)并将其添加到当前指数：

In [630]: gdp.rolling(window=3).apply(lambda win: win.argmin() - 2) + gdp.index 
Out[630]: 
0 NaN 
1 NaN 
2 1.0 
3 1.0 
4 2.0 
5 4.0 
6 4.0 
7 7.0 
8 7.0 
9 7.0 
dtype: float64

简易方法不会返回正确的结果，因为你ç不会预测当价值相等时以及中间上涨时它会返回哪个指数。但你明白这个主意。

来源

2016-11-18 11:08:06 newtover

感谢您的输入。这不是我正在寻找的。我需要知道如何访问自定义函数中win数组的各个元素。所以如果我有gdp.rolling（window = 3）。（lambda win：find_recession_start（win）），如何在find_recession_start（）中访问win的元素？ – Codedorf

@Codedorf：win [0]，win [1]，win [2]？ – newtover

是的！这就是我一直在寻找的。谢谢！ – Codedorf

在.apply（）中使用lambda表达式将传递一个数组到自定义函数（find_recession_start），所以我可以像访问任何列表/数组一样访问元素，例如arr[0], arr[1], arr[2]

df = pd.DataFrame(data=np.random.randint(0,10,10), columns=['GDP']) 

def my_func(arr): 
    if((arr[2] < arr[1]) & (arr[1] < arr[0])): 
     return 1 
    else: 
     return 0 

df['Result'] = df.rolling(window=3).apply(lambda x: my_func(x)) 
df 

    GDP Result 
0 8 NaN 
1 0 NaN 
2 8 0.0 
3 1 0.0 
4 9 0.0 
5 7 0.0 
6 9 0.0 
7 8 0.0 
8 3 1.0 
9 9 0.0

来源

2016-11-19 03:58:41 Codedorf

如何访问数据框上的滚动窗口中的单个元素

回答

相关问题