2017-06-02 49 views
0

我有一个图像的训练数据集。这些图像的范围从0-2500。但是,在我的测试数据集中,一些图像的范围从200-3000。我的问题是其中预处理步骤将用于那种数据的良好:哪个预处理步骤适合我的数据集?

  1. 规范化到零均值和单位方差
  2. 规范化到[0,1]
  3. 转换由正规化到范围0-2500 [0,1],然后用2500

感谢所有

+0

你唯一的选择是试验,看看哪一个更好。 –

回答

2

你喂到你的神经网络应该像您的测试数据尽可能接近的possibe数据相乘。这通常是通过标准化来完成的,因为这些值通常在类似的图像中是密切相关的。然而,这不能一般性地说,取决于你的使用情况。对于一般的经验法则,我建议你看看:http://ufldl.stanford.edu/wiki/index.php/Data_Preprocessing

+0

谢谢,Thomas Pinetz。你是完全正确的,我真的同意你的观点,训练和测试范围必须尽可能地接近。但是,就我而言,测试数据与'[0,2000]'相比,具有不同的范围'[200,3000]'。你认为选项2还是3更好?因为他们是相同的方法来规范图像 – user8264

+0

我会从选项2个人开始。如果测试错误不是应该的,我会尝试选择1作为替代。 –

+0

谢谢。一些论文将选项1称为选项2。谢谢你的帮助。在stanford的过程中,它也使用选项1 – user8264