训练图像大小 Faster-RCNN答案

【问题标题】：Training Image Size Faster-RCNN训练图像大小 Faster-RCNN
【发布时间】：2020-01-11 07:51:50
【问题描述】：

我将使用 fast-rcnn 为一个类训练我的数据集。我所有的图像都是 1920x1080 尺寸。我应该调整图像大小或裁剪图像，还是可以用这个大小进行训练？我的对象也非常小（大约 60x60）。

在配置文件中，尺寸写为 min_dimension: 600 和 max_dimension: 1024，因此我很困惑用 1920x1080 大小的图像训练模型。

【问题讨论】：

【解决方案1】：

如果您的对象很小，将图像调整为更小的尺寸不是一个好主意。您可以将 max_dimension 更改为 1920 或 2000，这可能会使速度降低一些。为了裁剪图像，您应该首先考虑对象在图像中的放置方式。如果裁剪会剪切很多对象，那么您将遇到很多截断情况，这可能会对模型的性能产生负面影响。

【讨论】：

感谢您的友好回复。如果我改变 max_dimension 那么模型仍然可以有效地学习对吗？我对训练或测试速度没有问题，它可以提高。裁剪图像将帮助我更好地检测小物体，或者我能否获得显着的改进？
看看this answer 是否有用。我认为裁剪图像是一个好主意，只要你的对象没有从中间切掉太多。这取决于您在每张图像中有多少对象以及它们在图像上的分布方式。

【解决方案2】：

如果你坚持使用faster-rcnn来应对这个任务，我个人推荐：

但如果我是你，我想试试：

【讨论】：