我正在尝试训练快速rccn的小数位检测模型。我正在使用新发布的tensorflow object detection API,到目前为止一直在对来自动物园的预训练faster_rcnn_resnet101_coco进行微调。我所有的训练尝试都产生了高精度但回忆率低的模型。在每个图像中约120个物体(数字)中,只有约20个物体被检测到,但是当检测到分类是准确的时候。 (另外,我能够从头开始训练我的裁剪图像,精度高,因此问题出在模型的检测方面。)每个数字在原始图像中平均为60x30(可能大约是其大小的一半。图像被输入到模型前调整后),这是与检测盒的示例图像我所看到的: 张量流模型中使用更快RCNN的小物体检测
什么是奇怪我是怎么能够正确地检测相邻的数字,但完全错过了像素尺寸非常相似的其余部分。
我已经尝试调整锚箱生成和first_stage_max_proposals
周围的超参数,但迄今为止没有任何改进结果。这里是我用过的一个例子config文件。我应该尝试调整哪些其他超参数?有关如何诊断问题的其他建议?我应该查看其他architectures还是我的任务看起来可以通过更快的rccn和/或SSD来实现?
本嗨 - 什么是你的数据集典型的图像分辨率? –
还要注意,在可视化器('visualize_boxes_and_labels_on_image_array')中,我们让最大盒数默认为20,最低分数阈值默认为0.5 - 如果您想要更宽容,您必须明确地重写这些。 –
现在我的大部分图像都是3264×2248,这是iPhone图像(至少是iPhone 6)的尺寸。感谢可视化器上的指针,我会检查一下。 –