2017-07-03 38 views
1

我正在寻找一种方法来查找滚动框架中的两个最大高点并计算斜率以推断可能的第三高点。熊猫发现两个滚动最大高点并计算斜率

我有这个问题:) a)如何找到第二高? b)如何知道两个高点的位置(对于一个简单的斜率:斜率=(MaxHigh2-MaxHigh1)/(PosMaxHigh2-PosMaxHigh1))?

我当然可以做这样的事情。但我只工作,如果high1> high2 :) 和我不会有相同的范围的高点。

import quandl 
import pandas as pd 
import numpy as np 
import sys 


df = quandl.get("WIKI/GOOGL") 
df = df.ix[:10, ['High', 'Close' ]] 

df['MAX_HIGH_3P'] = df['High'].rolling(window=3,center=False).max() 
df['MAX_HIGH_5P'] = df['High'].rolling(window=5,center=False).max() 

df['SLOPE'] = (df['MAX_HIGH_5P']-df['MAX_HIGH_3P'])/(5-3) 

print(df.head(20).to_string()) 
+0

“两个最大高度”似乎非常不适应。您必须定义它在您的环境中的含义,因为这没有一般意义。 –

+0

@ B.M。抱歉。我需要最高和第二高:) – Ele

回答

1

对不起有点混乱解决方案,但希望它有助于:

第一I定义一个函数,它接受作为输入numpy的阵列,检查是否至少2个元素不为空,然后计算斜率(根据您的公式 - 我认为),看起来是这样的:

def calc_slope(input_list): 
    if sum(~np.isnan(x) for x in input_list) < 2: 
     return np.NaN 
    temp_list = input_list[:] 
    max_value = np.nanmax(temp_list) 
    max_index = np.where(input_list == max_value)[0][0] 
    temp_list = np.delete(temp_list, max_index) 
    second_max = np.nanmax(temp_list) 
    second_max_index = np.where(input_list == second_max)[0][0] 
    return (max_value - second_max)/(1.0*max_index-second_max_index) 
变量DF

我有这样的:

enter image description here

而你只需要申请滚动窗口任何你喜欢的,例如,在应用到“高”:

df['High'].rolling(window=5, min_periods=2, center=False).apply(lambda x: calc_slope(x)) 

最终结果是这样的:

enter image description here

你也可以将其存储在另一栏中,如果你喜欢:

df['High_slope'] = df['High'].rolling(window=5, min_periods=2, center=False).apply(lambda x: calc_slope(x)) 

这就是你想要的吗?

+0

正是我所需要的。不,我需要一些时间来了解你做了什么!谢谢! E. – Ele