【发布时间】:2018-09-12 18:31:06
【问题描述】:
我正在试验 FCN(全卷积网络),并试图重现原始论文(Long 等人 CVPR'15)中报告的结果。
在那篇论文中,作者报告了 PASCAL VOC 数据集的结果。下载并解压 2012 年的 train-val 数据集后 (http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar ),我注意到 SegmentationClass 中有 2913 个 png 文件,而 SegmentationObject 子目录中有相同数量的文件。
这些 png 文件中的像素值似乎是 32 的倍数(例如 0、128、192、224...),它们不在 0 到 20 之间的范围内。我只是想知道什么是像素值和像素的地面实况标签之间的对应关系。还是我在看错误的文件?
【问题讨论】:
-
我最近复制了这些 FCN 结果,效果很好。你如何阅读你的图像?你调整它们的大小了吗?我曾经盲目地这样做,并且在调整大小时因为插值或平均值而弄乱了标签......
-
你发现了吗?我也在原始字节数据中看到了很多 224 个值。我在彩色地图的任何地方都看不到 224。这是否意味着它们未定义? VOC_COLORMAP = [[0, 0, 0], [128, 0, 0], [0, 128, 0], [128, 128, 0], [0, 0, 128], [128, 0, 128] , [0, 128, 128], [128, 128, 128], [64, 0, 0], [192, 0, 0], [64, 128, 0], [192, 128, 0], [ 64, 0, 128], [192, 0, 128], [64, 128, 128], [192, 128, 128], [0, 64, 0], [128, 64, 0], [0, 192, 0], [128, 192, 0], [0, 64, 128]]