2017-10-21 56 views
0

我有以下代码:快速R-CNN和问题spatialScale在BrainScript

model (features, rois) = { 

     convOut = convLayers (features) 
     roiOut = ROIPooling (convOut, rois, (9:9),spatialScale=64.0/196.0) 
     z = fcLayers (roiOut) 


    }.z 

原文摘自:cntk \例子\图片\检测\ FastRCNN \ BrainScript

什么是spatialScale在ROIPooling我该如何计算它?

如果在cntk.exe的输出中找到了它。

正在验证 - > z.convOut.z.rn3.rr = RectifiedLinear(z.convOut.z.rn3.rr_):[49 x 49 x 64 x *] - > [49 x 49 x 64 x *]

验证 - >的ROI = inputValue的(): - > [4×1000×*]

验证 - > z.roiOut = ROIPooling(z.convOut.z.rn3.rr,感兴趣区):[49 x 49 x 64 x *],[4 x 1000 x *] - > [9 x 9 x 64 x 1000 x *]

回答

1

空间尺度是输入的空间分辨率与ROI和输入图像到网络的空间分辨率。 1/16.0是原始快速和更快的R-CNN实现中使用的值,该值取决于网络。

相当多,空间尺度是ROI相对于原始图像输入的比例尺。

感谢,
伊马德

+0

所以我的例子中,我都设有64×64的ROI和196x196一个输入图像。这将给出一个spatialScale = 64/196 = 0.32 –

+0

你的ROI节点的输入分辨率是多少,而不是ROI的大小。 –

+0

好的,如果我正确理解你,你要求输入分辨率给roiOut。我已经添加了我认为是问题的解决方案。 –