1

在TensorFlow示例中的Cifar10示例中,他们使用裁剪,翻转,增亮,对比和美白的随机组合来扭曲图像。这个概念是有道理的,除了裁剪对我来说似乎有点奇怪。这些图像将需要对网络和裁剪代码相同的尺寸看起来是这样的:TensorFlow - Cifar10示例中的random_crop是什么?

height = IMAGE_SIZE 
    width = IMAGE_SIZE 

    # Image processing for training the network. Note the many random 
    # distortions applied to the image. 

    # Randomly crop a [height, width] section of the image. 
    distorted_image = tf.random_crop(reshaped_image, [height, width, 3]) 

由于高度和宽度都是基于图像尺寸为这实际上做什么?

回答

1

在此示例中,IMAGE_SIZE设置为24。所以基本上这个代码所做的是选择一个随机选择的偏移量并提取一个24 X 24补丁。它可能确保偏移的选择方式可以在没有任何环绕或其他奇怪边界条件的情况下提取补丁,或者可以填充它(应该很容易检查)。

我猜IMAGE_SIZE可能会更好地命名为PATCH_SIZE什么的。请注意原始的CIFAR 10输入图像是32 x 32

+0

谢谢,这清除它! –

+0

@bradden_​​gross很高兴能够提供帮助! –