2009-08-13 129 views
1

如何计算一组数据的平均值,同时对超出“标准”范围的任何点进行平滑处理。这是一段时间,因为我不得不做任何真正的数学,但我敢肯定,我知道这个地方...销售数据的平滑平均值

可以说我有一个项目的销售数据12天:2,2,2,50, 10,15,9,6,2,0,2,1

我想计算每天的平均销售额,但不允许第4天(50)将平均数过高。日志,百分点,这样的东西我认为...

+1

我所有的统计教师都教过我,我们不应该因为不符合要求而删除数据。不过,我仍然会马上答复马特的回答。 – mcandre 2009-08-13 18:52:19

+0

是的,你绝对不想删除数据。 12天的平均值是50美元,是平均值的一部分。您也可能对该数据集的平均销售额为2而感兴趣,而平均值为8.4。 – 2009-08-13 18:56:07

+0

如果您将平均值用作未来销售额的预测值,删除异常值是完全正常的。 – 2009-08-13 18:58:13

回答

5

这听起来对你而言,你正在寻找一个moving average

+0

啊!完美,我知道它有一个名字。 – 2009-08-13 19:00:54

1

您也可以通过阈值的某些倍数的标准偏差进行过滤。这将过滤掉比平均值(平均值)远远超出预期的结果。

标准偏差只是sqrt(sum(your_values - average_value)/ number_of_values)。

编辑:你也可以看看通过偏离平均值来衡量值。因此,非常大的值可以被加权为1/exp(偏差),因此贡献远离它们的平均值的距离要小得多。

1

你会想要使用像IQR(interquartile range)。基本上,你将数据分成四分位数,然后计算第一和第三四分位数的中位数。那么你可以得到你的数据集中趋势。