【发布时间】:2018-10-19 09:25:01
【问题描述】:
我刚开始研究 Pascal VOC 分割数据集。但是我很难理解他们在地面标签中使用的颜色编码。我假设每个类的像素将被注释为 1 到 20,但我得到的是具有像素值 (0-255) 的 8 位深 png 图像。
对于2007_000033.png 中属于aeroplane 类的某个像素,我得到值:(128, 0, 0);而在2007_000123.png 中属于train 类的另一个像素给出的值是:(128, 0, 192) 等等。
如何将它们区分为不同的类并进行一次性编码?我是否需要为每个类指定像素值(例如使用 (128, 0, 0) 搜索像素并将它们编码为类 aeroplane 的 1)?
抱歉,我在 SO 上看到了一些类似的问题,但没有任何帮助。谢谢。
【问题讨论】:
-
您可能应该检查每个像素的类别并将其映射到某种颜色。看看这个gist.github.com/wllhf/a4533e0adebe57e3ed06d4b50c8419ae。
-
感谢@MattSt。这应该没问题。
标签: python image-segmentation convolutional-neural-network labeling semantic-segmentation