【发布时间】:2017-04-27 09:51:39
【问题描述】:
我是机器学习的新手。我正在尝试从一组图像(斯坦福犬组 120 个品种)创建一个输入矩阵 (X) 来训练卷积神经网络。我的目标是通过使每个像素成为单独的列来调整图像大小并将每个图像变成一行。
如果我直接将图片调整为固定大小,图片会因为挤压或拉伸而失去原创性,这是不好的(第一种解决方案)。
我可以通过固定宽度或高度来调整大小,然后对其进行裁剪(所有生成的图像将与 100x100 大小相同),但可以裁剪图像的关键部分(第二种解决方案)。
我正在考虑另一种方法,但我敢肯定。假设我想要每个图像 10000 列。我不会将图像大小调整为 100x100,而是调整图像大小,使总像素数约为 10000 像素。因此,大小为 50x200、100x100 和 250x40 的图像将全部转换为 10000 列。对于 52x198 等其他尺寸,将考虑 10296 中的前 10000 个像素(第三种解决方案)。
我上面提到的第三种解决方案似乎保留了图像的原始形状。但是,由于并非所有图像都具有相同的大小,因此在转换为行时可能会失去所有这些独创性。我想知道你在这个问题上的cmets。如果您能将我引导到我可以了解该主题的资源,那也很棒。
【问题讨论】:
标签: image machine-learning neural-network classification conv-neural-network