机器学习和不同大小的图像

可以说我有一个机器学习系统，已经学会识别图像是否包含对象（例如汽车）。机器学习和不同大小的图像

我的问题是以下几点，当系统接收到不同大小的图像时该怎么办？例如训练集可以由1000x700像素的图像组成，但是真实世界不是那么统一，并且可以预期图像为700x1000,700x400 ...

第一个冲动是将图像调整为具有与训练集大小相同，但感觉肮脏，并不真正有用。

我在这里错过了一些明显的东西吗？另外，即使对于训练集，我也认为假设每个图像的大小都是固定的（再次假设为1000x700像素）并不合理。另外，如果使用滑动窗口技术，可能会出现同样的问题，因为确定正确的窗口大小并不容易。

我想这应该是一个相对普遍的问题，所以必须有一套共同的解决方案，它的任何想法？

是的。共同的解决方案是

现在...裁剪通常是通过一系列裁剪照片完成的：所有四个角落和中心。在上面的（1）中，将只有三个图像，而不是5.

2016-09-20 00:08:05 Prune

滑动窗口的大小如何？ –

四角法是滑动窗口的退化版本。你仍然保持窗户到所需的大小。当原件比所需尺寸大得多（至少2倍）时，滑动窗口很好，并且在所有区域都具有有用的功能。 – Prune

回答