2

假设我有所有这些商业产品标志(它们只是图片)在我的数据库,我把这些标识的照片在现实世界中,我怎样才能让这个我的程序可以在我的照片检测这种标志?该约束是:如何检测图像中的特定目标“徽标”,何时可以变形?

例如,足球运动员可以穿有可口可乐标志衬衫,衬衫都超过了皱纹,这扭曲了的标志。这是一个它可能看起来如何的例子。左边是原始的,而右边则是扭曲的版本:

logo test C

另一个例子是我拿一条街的照片正前方,并在照片中,有一个麦当劳在人行道上签字从照片的角度来看,在人行道上这个麦当劳的标志可能看起来像右边的“M”,而左侧的“M”是原始图像:

logo test M

所以考虑到这些限制,在现实世界中,徽标可能会以任何方式扭曲,当然,如果l照片中的ogo被扭曲到我们无法确定的地步,那么这就超出了范围。但是,如果标识有原始的“气味”,那么它应该是可能的,不是?

我如何检测在这种情况下,照片中的标志?我应该寻找哪些算法或方法?

+0

更适合dsp.stackexchange.com –

回答

2

这更多的是一种机器学习任务。以尽可能多的扭曲视图获取徽标的一些示例图像。然后训练一些物体探测器为你找到标志。

事情你可能要考虑

  • 您将需要大量的训练数据来做到这一点。你可能想生成合成(镜像)的失真得到足够的训练数据

  • 对目标检测的文献丰富了许多不同的算法。没有解决方案可以直接使用。尝试几种算法,我会先从一个单词开始,或者以SVM的形式开头

  • 您可能必须执行“滑动窗口”检测样式才能在图像中查找徽标。将徽标设想为您想要在一堆数据中检测到的2D模式

祝您好运!

相关问题