对于那些处理数据的人来说,有句话说:“如果你充分拷打数据,它会承认几乎任何东西”。这一点在Boferroni定理的数学支持下表明,“随着越来越多的统计测试的执行,获得错误重要发现(类型I错误)的可能性也增加”。例如,我们知道Principles of Data Mining中给出的情况:“Leinweber(个人通信)提供了这种类型预测的一个特别幽默的例子,他几乎完美地预测了着名的标准普尔500金融指数作为前几年黄油生产,奶酪生产和孟加拉国和美国 绵羊种群的年度值的函数。“数据处理过于复杂的模型
在使用过于复杂的模型时,您是否遇到实际情况,结果是错误的?你能否提出这种情况,以及你使用的方法?
优秀的答案......谢谢。 – lmsasu 2009-07-30 07:44:14