2017-04-03 94 views
1

我对CNTK很新颖。 我想用CNTK-ResNet/Fast-R CNN训练一组图像(用于检测酒精杯/酒瓶等物体)。使用CNTK进行对象检测

我想从GitHub下面的文档;但是,这似乎并不是一个简单的过程。 https://github.com/Microsoft/CNTK/wiki/Object-Detection-using-Fast-R-CNN

我找不到合适的文档来为具有不同大小和形状的图像生成ROI。以及如何基于训练好的模型创建对象标签?有人可以指出一个适当的文档或培训链接,使用我可以在cntk模型上工作吗?请参阅附加的图像,我可以在脚本中加载具有默认ROI的示例图像。如何正确设置尺寸并在图像中标注对象?提前致谢!

sample image loaded for training

回答

0

不知道你的意思是正确的文件。这是本文的实施(https://arxiv.org/pdf/1504.08083.pdf)。看起来你正在努力产生投资回报率。您可以通过辅助功能看起来在现场记录来分析你可能需要的东西:

要运行的玩具例子,确保在PARAMETERS.py的数据集名称设置为“杂货店”。

  • 运行A1_GenerateInputROIs.py生成用于训练和测试输入的ROI。

  • 运行A2_RunCntk_py3.py使用CNTK Python API训练Fast R-CNN模型并计算测试结果。

的ALGO将工作在几个候选区,然后生成输出:一个用于对象的类和另外一个,生成用于属于这些类别中的对象的边界框。请参阅代码以获取实施细节。

0

有人可以指出一个适当的文档或培训链接使用我可以在cntk模型上工作吗?

你可以看看my repository on GitHub

它将引导您完成所有需要的步骤,以培训您自己的CNTK对象检测和分类模型。

但在短期适当的步骤应该是这个样子:

  1. 安装环境
  2. 准备数据
  3. 标签图像(地面实况)
  4. 下载预训练的模式,创建映射为您定制数据集
  5. 运行训练
  6. 评估测试仪上的模型