2017-06-16 114 views

回答

1

输入大步是过滤器的步幅。你在输出中移动了多少过滤器。

输出步幅这实际上是一个名义值。我们在做了几次卷积,最大化池操作后,在CNN中获得了特征映射。假设我们的输入图像是224 * 224而我们的最终功能图是7 * 7

然后我们说我们的输出步幅:7分之224= 32(近似发生的事情向下采样后的图像。)

这tensorflow script形容这是什么输出步幅,以及如何在FCN使用这是密集预测的情况。

一个使用输入与 空间维度的倍数为32加1,例如[321,321]。在 这种情况下,ResNet输出处的特征映射将具有与输入图像边角完全对齐的空间形状 [(height_1)/ output_stride_1,(width_1)/ output_stride_1], 便于将特征与图像对齐。使用图像作为输入[225,225] 图像在最后的ResNet块的输出处产生[8,8]特征映射。