3

我想开发一个应用程序,需要知道图像中标记对象的位置。知道图像中存在“钢琴”是不够的,我需要知道钢琴在图像中的位置。Microsoft Computer Vision API或Google的Cloud Vision API是否可以获取对象的位置?

微软的计算机视觉API和谷歌的云视觉API都提供了某种形式的裁剪建议/智能缩略图生成服务,这让我认为某些对象的位置正在被检测 - 但是有没有办法获得这些信息(像微软计算机视觉API或Google的Cloud Vision API中围绕每个检测到的物体的边框)?


编辑:我明白,这两个API可以返回一个图像中检测到的面部的位置,但是我正在寻找位置和每个对象的大小的图像在:汽车,钢琴,树木,人物。 ..anything。

+0

[如何使用视觉识别api获取图像上自定义对象的位置](http://stackoverflow.com/questions/38634409/how-to-get-a-position-of-custom-object -on-image-using-vision-recognition-api) – Nakilon

回答

0

Microsoft Vision API不为检测到的对象提供像素坐标(请参阅返回功能:https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa)。

但是,如果要检测人员,Microsoft API可以返回面部矩形的坐标。

+0

查看我的编辑 - 我正在寻找的不仅仅是脸部位置,但我明白这些API可能不是我所期待的。 – abagshaw

+0

在这种情况下,Microsoft API不适用 – DaveStat

+0

关于Google API或任何其他API的任何想法? – abagshaw

0

我不知道任何API在这个时候为您提供对象的坐标。我推荐使用的是YOLO,它提供了对象的坐标。您可以使用预先训练的模型或训练您自己的模型。

但是,它不是API,你需要编写一些后端远程运行。

相关问题