我们需要建立一个车间模型,在该模型中,我们可以将摄像机图像的像素坐标(x,y)与商店3D空间中的实际物体相关联。照相机图像将作为生成这种模型的来源,会受到鱼眼失真的影响。因此,直线实际上在照相机图像中以曲线形式出现,并且墙壁看起来不完全直角地彼此相遇。如何将二维坐标从商店图像映射到商店的实际货架?
我们将该区域细分为多边形。图像上的每个多边形指的是特定的区域,例如货架,显示区域,结帐计数器等。通过映射落在每个多边形中的像素,我们希望将其关联为属于与该区域对应的货架。
任何想法如何去呢?
以下是一些多边形商店的样本图像标记:
编辑: 我们并不想找出3D坐标,我们只需要知道哪个架子任何多边形映射到。所以如果用户点击一个多边形,我们可以说他点击了哪个架子。
我们可以管理上面的图像中显示的大多边形,但是远离摄像机的架子可能只有几个像素,所以我们需要某种概率结果,说明用户点击(x,y)他试图点击Shelf-A的概率是多少,或者他试图点击Shelf-B的概率是多少等等。
基本上,我们正在寻找的是一个概率函数,它将返回在2D图像上点击小多边形(或像素)时点击附近对象的概率。
EDIT2: 一件事是不从样品图像显而易见的是,多边形的尺寸可以是非常小(小至几个像素)和反过来多边形可能是非常接近彼此。
此外,使用案例是商店中的顾客从其中一个货架挑选产品。应用程序用户将点击他认为产品被拾取的图像中的一个点。现在由于多边形太小而太近,用户只能猜测拾取的确切点,所以我们最多只能知道它可能是靠近点击点的3-4个多边形中的任何一个。所以问题是如何计算这些3-4多边形给定点击的概率?
正如这里所建议的,点击距多边形中心的距离及其面积可能是计算这个概率的参数,我想知道的是如果有算法这样做的话。
你究竟想做什么? – Unreason 2011-03-17 12:48:31
当你的客户需要非常精确的目标时,你认为这是一个很好的用户体验吗?你能向用户列出可能的命中列表(也许这就是你想要做的)?欧几里得距离'dist = |点 - 多边形的中心|'可以用于排序并且阈值的最大距离。 – bjoernz 2011-03-17 20:29:31