使用张量流来识别乐高积木？

阅读this article关于一个使用tensorflow将黄瓜分为九个不同类的家伙，我想知道这种类型的过程是否可以应用于大量的类。我的想法是用它来识别乐高部件。使用张量流来识别乐高积木？

目前，像Bricklink这样的网站描述的不止是40,000 different parts，所以它会比黄瓜的例子有点不同，但我想知道它是否听起来合适。没有简单的方法可以为每个部件获得数百张照片，但是可以采用以下过程声音：

拍摄零件的照片;
尝试使用张量流确定零件;
如果它没有识别正确的部分，拍摄更多的图片并将它们与神经网络一起馈送;
继续下一部分。

这样，每当我们遇到一件新作品时，我们都会“教”网络的参考，以便下次更好地认识到它。像这样，经过人类监测的数百次迭代之后，我们可以想象tensorflow能够识别这些部分吗？至少最常见的是？

我的问题可能听起来很愚蠢，但我不进入神经网络，所以任何建议都是值得欢迎的。目前我还没有找到任何方法来识别基于图片的乐高部分，这个“黄瓜的例子”听起来很有希望，所以我正在寻找一些反馈。

谢谢。

来源

2016-09-14 Sylvain

请记住，你把所有的部分，这至少是你可以用它来制作训练图像 – Eric

你可以阅读有关雅克Mattheij的工作，他居然使用在https://keras.io/上运行的定制版本的Xception 。

引言是Sorting 2 Metric Tons of Lego。

在Sorting 2 Tons of Lego, The software Side你可以阅读：

面临的艰巨挑战，以应对未来是得到训练集大足以让与1000+类可能的工作。起初这个似乎是一个不可逾越的问题。我不知道如何足够的图像，并在可接受的时间手动标记他们，即使最乐观的计算让我工作了6个月或更长的时间全职为了做一个数据集，将允许机到与许多类的部分工作，而不仅仅是一对夫妇。

最终，解决方案在我最后一次提示之前至少在一周内注视着我：：没关系。重要的是，机器大多数时间标记自己的图像，然后我需要做的所有是正确的错误。随着它变得越来越好，将会有更少的错误。这非常迅速地扩大了训练图像的数量。第一天我设法手工标记了大约500个零件。第二天该机器增加了2000多个，其中约一半标记为错误。由此产生的2500个零件在下一轮训练3天后的基础上，这导致4000多个零件，90％其中被标记为正确！所以我只需要纠正一些400部分，冲洗，重复...因此，在两周结束时，有一个20K图像的数据集，所有标记正确。

这是远远不够的，一些类是严重不足的所以我需要增加对这些图像的数量，也许我会刚刚经历机器运行单个批次包括什么，但那些部分。不需要更正，它们全部标记为。

最近的更新是Sorting 2 Tons of Lego, Many Questions, Results。

CHOLLET, François. Xception: Deep Learning with Depthwise Separable Convolutions. arXiv preprint arXiv:1610.02357, 2016.

来源

2017-07-11 13:44:48

感谢亚历山德罗的三维CAD模型，我已经错过了这个博客帖子，他似乎说这个解决方案比Tensorflow真的更有效率，所以我会接受这个答案，因为它似乎是最好的方式！谢谢。 – Sylvain