【问题标题】:Understanding Faster rcnn了解更快的 rcnn
【发布时间】:2017-08-06 09:38:00
【问题描述】:

我正在尝试理解 fast(er) RCNN,以下是我正在寻找的问题:

  1. 要训练一个 FastRcnn 模型,我们是否必须给出边界框 训练阶段的信息。
  2. 如果您必须提供绑定框信息,那么它的作用是什么 ROI 层。
  3. 我们可以使用预训练模型吗,它只训练分类,不训练 对象检测并将其用于 Fast(er) RCNN

【问题讨论】:

    标签: machine-learning deep-learning detection


    【解决方案1】:

    你的答案:

    1.- 是的。

    2.- ROI 层用于从可变大小的图像生成固定大小的矢量。这是通过使用最大池化来执行的,但不是使用典型的 n x n 单元,而是将图像划分为 n x n 个非重叠区域(大小不同),并输出每个区域中的最大值。 ROI 层还负责将输入空间中的边界框投影到特征空间。

    3.- Faster R-CNN 必须与预训练网络(通常在 ImageNet 上)一起使用,它不能进行端到端训练。这在论文中可能有点隐藏,但作者确实提到他们使用了来自预训练网络(VGG、ResNet、Inception 等)的特征。

    【讨论】:

    • 感谢您解释每一点。它减少了我的困惑。最后一个问题。有没有一种方法可以在我的训练数据中不提供边界框的情况下进行对象检测。我要执行对象检测的数据集不包含图像中对象的精确坐标。
    • @Ahmad.Masood 不使用 Faster R-CNN,您想要的称为弱监督对象检测,需要不同的算法,并且在数据集中具有适当的边界框效果不佳。只需标记您的数据。
    • 感谢您的建议。
    猜你喜欢
    • 2017-06-14
    • 1970-01-01
    • 2016-11-15
    • 2021-03-17
    • 2020-02-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-02-06
    相关资源
    最近更新 更多