2016-11-05 130 views
0

我有一个包含每个车辆边界框(宽度,高度,角度,x轴,x轴,x轴)的txt文件的10 jpeg高质量航拍图像的数据集。这是一个例子:如何为图像处理创建训练数据集

@CATEGORY:GENERAL 

@IMAGE:2012-04-26-Muenchen-Tunnel_4K0G0010.JPG 

#format: id type center.x center.y size.width size.height angle 

0 30 1319 2338 35 11 56.451578 

1 30 1337 2350 42 14 57.817368 

2 30 224 3556 61 20 136.967797 

我应该如何创建使用来自Caffe车辆的数据库在神经网络训练? 我是否应该使用photoshop来裁剪每辆车并逐一保存?或者可以使用txt文件创建不同类别的车辆在网络中训练...... Matlab

+0

如果你只有10张照片,你可以通过在Photoshop中使用本手册更快,但如果你想要你可以使用图像库来获取这些文件 – Maaaaa

+0

感谢你的回复。有10张图片,但有很多车辆在其中。我说的是成千上万..我是否必须将每辆汽车的确切边界分开,或者只是围绕它的边界框就足够了? –

回答

0

有了这么多的车辆,我不会用手去做。在Python中,您可以将图像加载到一个numpy数组中,然后使用文件中提供的数据选择框。你可以通过旋转整个数组来处理角度,然后用与选择'正常'相同的方式选择框。

如果您使用的是不同的编程语言,您应该可以遵循这种方法,您只需将jpeg转换为位图并以某种方式将其转换为数组即可。

我不知道咖啡,但通常需要捕捉确切的咖啡因,因为神经网络需要相同大小的盒子。

相关问题