Microsoft Computer Vision API或Google的Cloud Vision API是否可以获取对象的位置？

我想开发一个应用程序，需要知道图像中标记对象的位置。知道图像中存在“钢琴”是不够的，我需要知道钢琴在图像中的位置。Microsoft Computer Vision API或Google的Cloud Vision API是否可以获取对象的位置？

微软的计算机视觉API和谷歌的云视觉API都提供了某种形式的裁剪建议/智能缩略图生成服务，这让我认为某些对象的位置正在被检测 - 但是有没有办法获得这些信息（像微软计算机视觉API或Google的Cloud Vision API中围绕每个检测到的物体的边框）？

编辑：我明白，这两个API可以返回一个图像中检测到的面部的位置，但是我正在寻找位置和每个对象的大小的图像在：汽车，钢琴，树木，人物。 ..anything。

来源

2016-12-23 abagshaw

[如何使用视觉识别api获取图像上自定义对象的位置]（http://stackoverflow.com/questions/38634409/how-to-get-a-position-of-custom-object -on-image-using-vision-recognition-api） – Nakilon

Microsoft Vision API不为检测到的对象提供像素坐标（请参阅返回功能：https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa）。

但是，如果要检测人员，Microsoft API可以返回面部矩形的坐标。

来源

2016-12-23 21:06:35 DaveStat

查看我的编辑 - 我正在寻找的不仅仅是脸部位置，但我明白这些API可能不是我所期待的。 – abagshaw

在这种情况下，Microsoft API不适用 – DaveStat

关于Google API或任何其他API的任何想法？ – abagshaw

我不知道任何API在这个时候为您提供对象的坐标。我推荐使用的是YOLO，它提供了对象的坐标。您可以使用预先训练的模型或训练您自己的模型。

但是，它不是API，你需要编写一些后端远程运行。

来源

2017-04-25 10:59:33

Microsoft Computer Vision API或Google的Cloud Vision API是否可以获取对象的位置？

回答

相关问题