【发布时间】:2017-08-06 09:38:00
【问题描述】:
我正在尝试理解 fast(er) RCNN,以下是我正在寻找的问题:
- 要训练一个 FastRcnn 模型,我们是否必须给出边界框 训练阶段的信息。
- 如果您必须提供绑定框信息,那么它的作用是什么 ROI 层。
- 我们可以使用预训练模型吗,它只训练分类,不训练 对象检测并将其用于 Fast(er) RCNN
【问题讨论】:
标签: machine-learning deep-learning detection
我正在尝试理解 fast(er) RCNN,以下是我正在寻找的问题:
【问题讨论】:
标签: machine-learning deep-learning detection
你的答案:
1.- 是的。
2.- ROI 层用于从可变大小的图像生成固定大小的矢量。这是通过使用最大池化来执行的,但不是使用典型的 n x n 单元,而是将图像划分为 n x n 个非重叠区域(大小不同),并输出每个区域中的最大值。 ROI 层还负责将输入空间中的边界框投影到特征空间。
3.- Faster R-CNN 必须与预训练网络(通常在 ImageNet 上)一起使用,它不能进行端到端训练。这在论文中可能有点隐藏,但作者确实提到他们使用了来自预训练网络(VGG、ResNet、Inception 等)的特征。
【讨论】: