我有一个熊猫数据框,包含以下领域展开像场:在大熊猫数据帧
ID TYPE_01 TYPE_02 SPRITE
1 12 8 [Image]
2 11 9 [Image]
3 9 nan [Image]
4 3 12 [Image]
5 8 nan [Image]
TYPE_01和TYPE_02是在图像分类,我会尝试使用机器学习方法进行分类(我我正在使用sklearn)。 SPRITE包含一个64x64 HSV图像,我将用于训练方法。
我想在PCA分解中使用一个尺寸(#记录,64 * 64 * 3)的大2D矩阵中的图像,但我遇到了一些问题。我设法使用for循环遍历每个记录,但我认为这可能有点低效(我分配了一个新数组,并通过记录扁平图像来分配记录)。
有没有更好的方法来做到这一点使用熊猫/ Numpy?如果使用df.values.shape
得到数据帧的形状,我会得到一个(#Records,4)
,所以对整个数据帧进行简单的平坦化,拆散或重塑对我没有帮助。
我看了一些类似的问题行this one,但他们并不适用于这种情况。
精灵3d numpy数组? – James
是的。它们是(64 x 64 x 3),并且在所有记录中具有相同的维度。 – hemagso