我从一个大学项目开始,我正在寻找一个工具,帮助我找到图像中特定对象的像素坐标(X,Y)(我不是在谈论文本)。我想知道IBM Watson视觉识别是否可以帮助我实现这一目标,或者如果您知道任何其他可以更好地工作的工具。IBM Watson视觉识别。是否可以从特定对象获取X,Y坐标?
谢谢。
我从一个大学项目开始,我正在寻找一个工具,帮助我找到图像中特定对象的像素坐标(X,Y)(我不是在谈论文本)。我想知道IBM Watson视觉识别是否可以帮助我实现这一目标,或者如果您知道任何其他可以更好地工作的工具。IBM Watson视觉识别。是否可以从特定对象获取X,Y坐标?
谢谢。
你也可以采取混合“云边”的方法,如下所述:https://medium.com/unsupervised-coding/dont-miss-your-target-object-detection-with-tensorflow-and-watson-488e24226ef3
它使用本地运行检测区一TensorFlow模型,然后使用沃森VR要说一下的是在每个区域。这结合了TensorFlow的灵活性和Watson VR对许多(数以万计)不同类型的对象进行分类的能力。
你可以用Watson的视觉识别来做到这一点。首先,您需要训练一个自定义分类器来“查找”您正在查找的对象。一旦你完成了这个,你已经完成了一半。
第二部分涉及拍摄想要查找对象的图像,并将其分为四部分(左上角,左下角,右上角,右下角)。然后,您搜索图像的每个部分作为目标对象。如果您在其中一个象限中找到它,那么您将该象限分成四个部分,然后在图像的每个部分搜索目标对象。如果您继续并递归执行此操作(并跟踪每个象限和子象限的像素边界),最终您将缩小搜索对象的范围。
现在你应该也想做其他的搜索算法。考虑目标对象位于图像中心的情况 - 它不会出现在任何象限中。如果您的对象碰巧跨越象限边界,则无法获得准确的位置,因此需要多种搜索模式,但策略和方法是相同的。