Pascal VOC 类分割：用于训练的真实像素标记答案

【问题标题】：Pascal VOC Class Segmentation: Ground-truth pixel labeling for trainingPascal VOC 类分割：用于训练的真实像素标记
【发布时间】：2018-10-19 09:25:01
【问题描述】：

我刚开始研究 Pascal VOC 分割数据集。但是我很难理解他们在地面标签中使用的颜色编码。我假设每个类的像素将被注释为 1 到 20，但我得到的是具有像素值 (0-255) 的 8 位深 png 图像。

对于2007_000033.png 中属于aeroplane 类的某个像素，我得到值：(128, 0, 0);而在2007_000123.png 中属于train 类的另一个像素给出的值是：(128, 0, 192) 等等。

如何将它们区分为不同的类并进行一次性编码？我是否需要为每个类指定像素值（例如使用 (128, 0, 0) 搜索像素并将它们编码为类 aeroplane 的 1）？

抱歉，我在 SO 上看到了一些类似的问题，但没有任何帮助。谢谢。

【问题讨论】：

您可能应该检查每个像素的类别并将其映射到某种颜色。看看这个gist.github.com/wllhf/a4533e0adebe57e3ed06d4b50c8419ae。
感谢@MattSt。这应该没问题。

标签： python image-segmentation convolutional-neural-network labeling semantic-segmentation

【解决方案1】：

我向自己提出了一个类似的问题，这让我很长时间感到困惑。我想我找到了一个可能的解释：

如果您查看file_download_and_convert_voc2012.sh，有几行标有“# Remove the colormap in ground truth annotations”。这部分处理原始SegmentationClass文件并生成原始分割图像文件，每个像素值在0:20之间。（如果您可能会问为什么，请查看此帖子：Python: Use PIL to load png file gives strange results）

【讨论】：