2017-02-24 72 views
1

我想使用图像文件(约10,000张图像,大小各异)作为输入文件,以使图像识别程序可能使用CNN(或RNN)。如何在深度学习平台上将各种尺寸的图像作为RNN或CNN的输入文件?

我不介意使用任何像Tensorflow,Caffe,Spark + Tensorflow等深度学习平台。 看起来他们都使用像256 * 256这样的固定大小,但会有什么方法可以使用图像文件与所有不同的大小?

如果不是,那么当前支持最大图像像素大小的平台将作为其输入文件是什么?

回答

0

最好的想法是将您的图像缩放到所需的格式。神经网络的想法是为某种输入格式提供一定的输出。但是,您可以将该输入的大小更改为1000x1000,但这显然会导致较慢的学习过程。

256x256维度可能是对此事进行广泛研究并给出最佳结果的结果。