【问题标题】:Pascal VOC Class Segmentation: Ground-truth pixel labeling for trainingPascal VOC 类分割:用于训练的真实像素标记
【发布时间】:2018-10-19 09:25:01
【问题描述】:

我刚开始研究 Pascal VOC 分割数据集。但是我很难理解他们在地面标签中使用的颜色编码。我假设每个类的像素将被注释为 1 到 20,但我得到的是具有像素值 (0-255) 的 8 位深 png 图像。

对于2007_000033.png 中属于aeroplane 类的某个像素,我得到值:(128, 0, 0);而在2007_000123.png 中属于train 类的另一个像素给出的值是:(128, 0, 192) 等等。

如何将它们区分为不同的类并进行一次性编码?我是否需要为每个类指定像素值(例如使用 (128, 0, 0) 搜索像素并将它们编码为类 aeroplane 的 1)?

抱歉,我在 SO 上看到了一些类似的问题,但没有任何帮助。谢谢。

【问题讨论】:

标签: python image-segmentation convolutional-neural-network labeling semantic-segmentation


【解决方案1】:

我向自己提出了一个类似的问题,这让我很长时间感到困惑。我想我找到了一个可能的解释:

如果您查看file_download_and_convert_voc2012.sh,有几行标有“# Remove the colormap in ground truth annotations”。这部分处理原始SegmentationClass文件并生成原始分割图像文件,每个像素值在0:20之间。(如果您可能会问为什么,请查看此帖子:Python: Use PIL to load png file gives strange results

【讨论】:

    猜你喜欢
    • 2018-09-12
    • 1970-01-01
    • 2018-09-17
    • 2019-05-14
    • 2018-02-27
    • 1970-01-01
    • 2014-02-21
    • 2021-04-05
    • 1970-01-01
    相关资源
    最近更新 更多