一个新的专栏中,我有这样的应用列操作,以获得在大熊猫
ID 8-Jan 15-Jan 22-Jan 29-Jan 5-Feb 12-Feb LowerBound UpperBound
001 618 720 645 573 503 447 - -
002 62 80 67 94 81 65 - -
003 32 10 23 26 26 31 - -
004 22 13 1 28 19 25 - -
005 9 7 9 6 8 4 - -
我想创建一个使用95%的置信区间下限,并为每个产品上界两列中的数据。我知道写这遍历每个产品ID
import numpy as np
import scipy as sp
import scipy.stats
# Method copied from http://stackoverflow.com/questions/15033511/compute-a-confidence-interval-from-sample-data
def mean_confidence_interval(data, confidence=0.95):
a = 1.0*np.array(data)
n = len(a)
m, se = np.mean(a), scipy.stats.sem(a)
h = se * sp.stats.t._ppf((1+confidence)/2., n-1)
return m-h, m+h
是否有熊猫的有效方式或(一个衬垫之类的话)功能的手动方式?
这真的很聪明!它必须也相当快... – MaxU
@MaxU Thanks.It似乎像大熊猫也有一个方法。它比应用耶更快。 – ayhan