【发布时间】:2018-10-21 23:57:10
【问题描述】:
我正在阅读来自 Facebook Research 的论文 https://research.fb.com/wp-content/uploads/2017/08/maskrcnn.pdf。
Mask RCNN 基于检测器 Faster RCNN,但进行了一些改进,例如 FPN(特征金字塔网络),ROI align 似乎比 ROI 池更准确。但是,我不了解有关 FPN 的架构和 Mask RCNN 中的掩码。事实上,FPN 允许获取不同比例的特征图,但是看着纸上的图像我不明白他们是否只使用了 FPN 上的最后一个特征图。
所以,问题是:我们是只使用 RPN 的最后一个特征图,然后使用一些 conv 层来预测掩码(用于分割)还是我们也使用 RPN 的中间层?
【问题讨论】:
标签: deep-learning computer-vision image-segmentation image-recognition