2017-04-10 113 views
1

我是深度学习的新手,我在Keras上苦于某些数据格式。我的CNN基于A.Newell等人的Stacked Hourglass Networks for Human Pose Estimation如何格式化Keras上的训练输入和输出数据

在此网络上,输入为256x256 RGB图像,输出应为突出身体关节(肩,膝,...)的64x64热图。我设法建立了网络,并将所有数据(图像)与他们的注释(身体关节的像素标签)一起使用。我想知道如何格式化训练集的输入和输出数据来训练我的模型。目前我使用numpy数组(256,256,3)作为图像,我不知道如何格式化我的输出。我应该创建一个表[n,64,64,7]吗? (n是训练集的大小,7是我用来获得7个关节的热图的滤波器的数量)

谢谢你的时间。

回答

0

输出也可以是一个numpy数组。 考虑这个例子: 训练集:50张图像,大小为256x256x3。这可以组合成一个形状单一的numpy数组(50,256,256,3)。 格式化输出数据的类似方法。下面 示例代码:

#a, b and c are arrays of size 256x256x3 
    import numpy as np 

    temp = [] 
    temp.append(a) 
    temp.append(b) 
    temp.append(c) 
    output_labels = [] 
    output_labels = np.stack(temp) 

的output_labels阵列将形状(3x256x256x3)的。