2016-08-04 111 views
1

我只是从伊森Rublee Official Paper读ORB的官方文件,有点我觉得很难理解的部分“4.3学习的好二进制功能”ORB特征描述信息官方给出解释

我是冲浪在互联网上深入挖掘并找到下面的段落。我还没有得到这个实际的解释。你们中的任何一个人都可以用简单的语言来解释这一点“给定一个大小为m×m的局部图像块,并且假设用于强度测试的本地窗口 (即,在BRIEF中使用的箱式滤波器)的大小为r×r,则存在N =(m - r)2个这样的本地窗口

它们每两个都可以定义一个强度测试,所以我们有C2N位特征。在ORB的原始实现中,m被设置为31,产生228,150个二进制测试。我们最终得到一组205,590个候选比特特征,根据一个训练集,ORB根据贪婪算法选择至多256比特“

从官方文件和上面的段落得到的是这样的结论。

我们有一个31X31的补丁大小,并选择一个5X5的大小..我们将有N =(31-5)^ 2 = 676可能的子窗口。我没有得到以粗体标出的线条。删除重叠的测试意味着什么,我们可以获得205,590位特性?

回答

2

想象一个尺寸为31x31(补丁)和一个小的5x5窗口的小图像。这个窗口可以放置在图像中多少个不同的位置?如果你将它滑动1乘1像素,那么它可以放置在(31-5)^ 2 = 676个不同的位置,对吧?只有676个窗口的中心像素由2个元素组合,才有676!/(2!*(676-2)!)= 228,150个组合。在ORB描述符的情况下,他们对以1个像素为单位滑动窗口不感兴趣,由于某些窗口之间的重叠(它们非常接近),可能会噪声太大。然后,他们删除重叠的窗口,将它滑动5乘5像素,并使用它们的中心像素创建二进制测试,将总组合减少到205,590。