【发布时间】:2019-06-20 14:54:03
【问题描述】:
我正在研究脑肿瘤的分类。该数据集由不同角度的脑图像组成,带有肿瘤位置的边界和掩码。我裁剪了包含肿瘤的矩形,因为图像的其他部分无关紧要,并且由于拍摄图像的角度不同而有所不同。现在我得到了一系列肿瘤图像,每一个都属于 3 个可能的肿瘤病例中的 1 个。但是为了训练这些数据进行分类,我需要让二维图像阵列具有统一的形状。
可能的方法:
1) 将每张图片裁剪为固定尺寸(例如 100x100)。但这会导致数据丢失,并且根据图像中肿瘤的位置,我可能会因为到达图像边缘而面临不均匀的作物。
2) 将图像填充为固定形状,大于最大的裁剪图像形状(例如 350x350)。但这又会在我想的数据中引入噪声,我不确定如何在矩形的所有 4 个边上均匀填充图像。
由于这些似乎不可行,我正在寻找其他解决方案来解决这个问题。
【问题讨论】:
-
更大的分辨率会更好,但是你有多少张图片,裁剪前后的分辨率是多少?如果您有数千张图像,则较大的分辨率将需要大量 GPU 进行标准化,并且训练可能会很慢。
-
@Suleiman 我有 3064 张图片。裁剪后的肿瘤图像的形状从 (15, 15) 到 (350, 300) 不等
-
15x15 的尺寸很小,无法提取有用的特征,您使用什么机器学习算法进行分类?
-
@Suleiman 很少有图像实际上会那么小。平均形状为 (75, 75)。我将尝试各种分类算法,并提出一项性能最佳的研究。所以我将从 SVM、决策树和 CNN 开始。
-
好的,在这种情况下,我想 100x100 可能是一个不错的开始尺寸,然后如果可能的话,尝试使用更大和更小的尺寸,看看性能是否有所提高。
标签: python image-processing machine-learning classification multiclass-classification