如何计算一组数据的平均值,同时对超出“标准”范围的任何点进行平滑处理。这是一段时间,因为我不得不做任何真正的数学,但我敢肯定,我知道这个地方...销售数据的平滑平均值
可以说我有一个项目的销售数据12天:2,2,2,50, 10,15,9,6,2,0,2,1
我想计算每天的平均销售额,但不允许第4天(50)将平均数过高。日志,百分点,这样的东西我认为...
如何计算一组数据的平均值,同时对超出“标准”范围的任何点进行平滑处理。这是一段时间,因为我不得不做任何真正的数学,但我敢肯定,我知道这个地方...销售数据的平滑平均值
可以说我有一个项目的销售数据12天:2,2,2,50, 10,15,9,6,2,0,2,1
我想计算每天的平均销售额,但不允许第4天(50)将平均数过高。日志,百分点,这样的东西我认为...
您也可以通过阈值的某些倍数的标准偏差进行过滤。这将过滤掉比平均值(平均值)远远超出预期的结果。
标准偏差只是sqrt(sum(your_values - average_value)/ number_of_values)。
编辑:你也可以看看通过偏离平均值来衡量值。因此,非常大的值可以被加权为1/exp(偏差),因此贡献远离它们的平均值的距离要小得多。
你会想要使用像IQR(interquartile range)。基本上,你将数据分成四分位数,然后计算第一和第三四分位数的中位数。那么你可以得到你的数据集中趋势。
我所有的统计教师都教过我,我们不应该因为不符合要求而删除数据。不过,我仍然会马上答复马特的回答。 – mcandre 2009-08-13 18:52:19
是的,你绝对不想删除数据。 12天的平均值是50美元,是平均值的一部分。您也可能对该数据集的平均销售额为2而感兴趣,而平均值为8.4。 – 2009-08-13 18:56:07
如果您将平均值用作未来销售额的预测值,删除异常值是完全正常的。 – 2009-08-13 18:58:13