2017-03-03 91 views
0

我正在为将视觉世界转换为音频的视障人士开发项目。识别“通用”对象

我们更喜欢创建一个不需要互联网连接的原型。所以我们选择了OpenCV。阅读(很多)教程和文档后,我们能够训练OpenCV识别特定对象。例如:我们训练OpenCV识别某个椅子和一扇门。这工作正常。

但是,我们也试图在“通用”级别上训练OpenCV。应该可以识别(几乎)所有椅子。我们这样做是通过训练OpenCV来获得大量正面和负面图像,如下所示:http://coding-robin.de/2013/07/22/train-your-own-opencv-haar-classifier.html

实际结果并非我们所期望的 - 他无法识别任何主席。我知道,有很多不同的参数需要考虑(也许我们做了错误的事情),并且我们尝试了很多。但是我们的时间(不幸的是我们对opencv的了解)是有限的。

我们正在寻找一些关于如何训练opencv以识别泛型对象的建议。 我们从哪里开始? 是否opencv甚至适合做到这一点?

谢谢你的时间!

回答

0

Open CV是要使用的库。但物体识别是棘手的。通常当人们说他们正在做“对象识别”时,他们不是,他们正在处理一个图像,或者最多处理一系列相关图像,以分离成对象和背景。

要认识一张“椅子” - 从扶手椅到餐椅到宝座,所有东西几乎都是不可能的。我希望至少立体图像给予机会来检测平坦的表面。我毫不怀疑,通过大量的工作,你可以得到一个很好的结果,也许只是承认餐桌椅,但它是熟练的工作,它不仅仅是向分层分类器提供一些参数的情况。