【问题标题】:Training Image Size Faster-RCNN训练图像大小 Faster-RCNN
【发布时间】:2020-01-11 07:51:50
【问题描述】:

我将使用 fast-rcnn 为一个类训练我的数据集。我所有的图像都是 1920x1080 尺寸。我应该调整图像大小或裁剪图像,还是可以用这个大小进行训练? 我的对象也非常小(大约 60x60)。

在配置文件中,尺寸写为 min_dimension: 600 和 max_dimension: 1024,因此我很困惑用 1920x1080 大小的图像训练模型。

【问题讨论】:

    标签: tensorflow object-detection-api image-size faster-rcnn


    【解决方案1】:

    如果您的对象很小,将图像调整为更小的尺寸不是一个好主意。您可以将 max_dimension 更改为 1920 或 2000,这可能会使速度降低一些。为了裁剪图像,您应该首先考虑对象在图像中的放置方式。如果裁剪会剪切很多对象,那么您将遇到很多截断情况,这可能会对模型的性能产生负面影响。

    【讨论】:

    • 感谢您的友好回复。如果我改变 max_dimension 那么模型仍然可以有效地学习对吗?我对训练或测试速度没有问题,它可以提高。裁剪图像将帮助我更好地检测小物体,或者我能否获得显着的改进?
    • 看看this answer 是否有用。我认为裁剪图像是一个好主意,只要你的对象没有从中间切掉太多。这取决于您在每张图像中有多少对象以及它们在图像上的分布方式。
    【解决方案2】:

    如果你坚持使用faster-rcnn来应对这个任务,我个人推荐:

    1. 在配置文件中更改输入高度和宽度、最大值和最小值,这应该适用于您的数据集以成功执行。

    2. 将原始区域提案参数(也应该在配置文件中)更改为一定的比例和比例,例如 1:1 和 60。

    但如果我是你,我想试试:

    1. 在主干中添加一些快捷方式,因为它是一个需要高分辨率特征的小目标检测任务。

    2. 剪掉 fast-rcnn 头来提高性能,因为我只需要检测一个类是不是 THE 类(是背景或其他类),并且输出应该足以编码RPN 阶段的信息。

    【讨论】:

    • 添加快捷方式并切断 fast-rcnn 头是什么意思?你能再解释一下吗?
    • @EmreTatbak Shortcuts 表示跨层的连接。您可以参考类似 U-Net 的网络结构以获取更多信息。
    猜你喜欢
    • 2018-05-06
    • 2021-11-02
    • 2017-07-27
    • 1970-01-01
    • 2020-01-20
    • 2018-05-01
    • 2017-05-12
    • 2021-10-12
    • 1970-01-01
    相关资源
    最近更新 更多