2016-09-14 86 views
3

阅读this article关于一个使用tensorflow将黄瓜分为九个不同类的家伙,我想知道这种类型的过程是否可以应用于大量的类。我的想法是用它来识别乐高部件。使用张量流来识别乐高积木?

目前,像Bricklink这样的网站描述的不止是40,000 different parts,所以它会比黄瓜的例子有点不同,但我想知道它是否听起来合适。没有简单的方法可以为每个部件获得数百张照片,但是可以采用以下过程声音:

  • 拍摄零件的照片;
  • 尝试使用张量流确定零件;
  • 如果它没有识别正确的部分,拍摄更多的图片并将它们与神经网络一起馈送;
  • 继续下一部分。

这样,每当我们遇到一件新作品时,我们都会“教”网络的参考,以便下次更好地认识到它。像这样,经过人类监测的数百次迭代之后,我们可以想象tensorflow能够识别这些部分吗?至少最常见的是?

我的问题可能听起来很愚蠢,但我不进入神经网络,所以任何建议都是值得欢迎的。目前我还没有找到任何方法来识别基于图片的乐高部分,这个“黄瓜的例子”听起来很有希望,所以我正在寻找一些反馈。

谢谢。

+0

请记住,你把所有的部分,这至少是你可以用它来制作训练图像 – Eric

回答

1

你可以阅读有关雅克Mattheij的工作,他居然使用在https://keras.io/上运行的定制版本的Xception 。

引言是Sorting 2 Metric Tons of Lego

Sorting 2 Tons of Lego, The software Side你可以阅读:

面临的艰巨挑战,以应对未来是得到训练集大 足以让与1000+类可能的工作。起初这个 似乎是一个不可逾越的问题。我不知道如何 足够的图像,并在可接受的时间手动标记他们,即使 最乐观的计算让我工作了6个月或更长的时间 全职为了做一个数据集,将允许机到 与许多类的部分工作,而不仅仅是一对夫妇。

最终,解决方案在我最后一次提示之前至少在一周内注视着我: :没关系。重要的是, 机器大多数时间标记自己的图像,然后我需要做的所有 是正确的错误。随着它变得越来越好,将会有更少的错误 。这非常迅速地扩大了训练图像的数量。 第一天我设法手工标记了大约500个零件。第二天 该机器增加了2000多个,其中约一半标记为错误。 由此产生的2500个零件在下一轮 训练3天后的基础上,这导致4000多个零件,90%其中 被标记为正确!所以我只需要纠正一些400部分,冲洗, 重复...因此,在两周结束时,有一个20K图像的数据集, 所有标记正确。

这是远远不够的,一些类是严重不足的 所以我需要增加对这些图像的数量,也许我会 刚刚经历 机器运行单个批次包括什么,但那些部分。不需要更正,它们全部标记为 。

最近的更新是Sorting 2 Tons of Lego, Many Questions, Results


CHOLLET, François. Xception: Deep Learning with Depthwise Separable Convolutions. arXiv preprint arXiv:1610.02357, 2016.

+0

感谢亚历山德罗的三维CAD模型,我已经错过了这个博客帖子,他似乎说这个解决方案比Tensorflow真的更有效率,所以我会接受这个答案,因为它似乎是最好的方式!谢谢。 – Sylvain