1

我正在使用Tensorflow's object detection API构建RCNN检测网络。是否应该包含Tensorflow对象检测API的否定示例?

我的目标是检测户外视频中动物的边界框。大多数框架没有动物,只有动态背景。

大多数教程都侧重于培训自定义标签,但未提及负面训练样本。这些类别的检测器如何处理不包含感兴趣对象的图像?它只输出一个低概率,还是会强制尝试在图像中绘制边界框?

我目前的计划是在opencv中使用传统的背景减法来生成潜在的帧并将它们传递给训练好的网络。我是否还应该将一类“背景”边框包含为“负面数据”?

最后的选择是使用opencv进行背景减除,RCNN生成边界框,然后使用作物的分类模型来识别动物与背景。

回答

1

通常没有必要明确包含“负面图像”。这些检测模型会发生什么,他们将图像中不属于注释对象的部分作为底片使用。

+0

感谢您的思考(以及API方面的杰出工作),只需要清楚,当面对没有目标对象的图像时,单个类别探测器的预期行为是什么?低概率分数?覆盖整个框架的边界框? – bw4sz

+0

在这种情况下的希望是没有框会被退回:) –

0

如果你期望你的模型区分“找到一个数字”和“没有数字”,那么你几乎肯定需要在负面的例子上进行训练。将这些标记为“无图像”。在“无图像”的情况下,是的,使用整个图像作为边界框;不建议模型认识到更小的东西。

在“无图像”的情况下,您可能会得到一个较小的边界框,但这并不重要:在推理中,您将简单地忽略任何返回“无图像”的框。

当然,这里的关键问题是尝试一下,看看它对你有多好。

相关问题