这是在ai.stackexchange中询问的question的转贴。由于该论坛没有太多的牵引力,我想我可能会在这里尝试我的机会。深度学习:数据集包含不同尺寸和方向的图像
我有一个特定对象的不同维度的图像的数据集。该物体的几张图像也处于不同的方向。目标是学习对象的功能(使用自动编码器)。
是否有可能创建一个网络,该网络可以考虑输入图像的不同尺寸和方向,或者我应该严格考虑包含均匀尺寸图像的数据集?一般而言,用于培训深度网络的合格数据集的必要标准是什么?
这个想法是,我想避免预处理我的数据集,通过缩放规范化,重新定向操作等。我希望我的网络能够解释尺寸和方向的变化。请同样指出我的资源。
编辑:
作为一个示例,考虑由香蕉的图像的数据集。它们具有不同的尺寸,例如,265x525
px,1200x1200
px,165x520
px等等。90%的图像以一个正交方向显示香蕉(例如,正视图),其余的以不同的方向显示香蕉(例如,等距视图)。
据我所知,没有超参数可以在训练过程中根据输入维度控制cnn模型的结构。 – Dale
@Jugesh:你能否把第一段写在评论中? –