【发布时间】:2020-10-05 11:06:07
【问题描述】:
所以,我正在尝试创建一个 CNN,它可以预测 X 射线胸部图像中是否有任何“支持设备”,但是在训练我的模型时,它似乎没有学到任何东西。
我正在使用一个名为“CheXpert”的数据集,它有超过 200.000 张图像可供使用。在做了一些“清理”之后,最终的数据集最终得到了 100.000 张图像。 就模型而言,我导入了 vgg16 预训练模型的卷积基础,并由我自己添加了 2 个完全连接的层。然后,我冻结了所有的卷积基础,只让完全连接的层可以训练。代码如下:
from keras.layers import GlobalAveragePooling2D
from keras.models import Model
pretrained_model = VGG16(weights='imagenet', include_top=False)
pretrained_model.summary()
for layer in pretrained_model.layers:
layer.trainable = False
x = pretrained_model.output
x = GlobalAveragePooling2D()(x)
dropout = Dropout(0.25)
# let's add a fully-connected layer
x = Dense(1024, activation='relu')(x)
x = dropout(x)
x = Dense(1024, activation = 'relu')(x)
predictions = Dense(1, activation='sigmoid')(x)
final_model = Model(inputs=pretrained_model.input, outputs=predictions)
final_model.compile(loss='binary_crossentropy', optimizer='rmsprop', metrics=['accuracy'])
据我所知,正常的行为应该是准确率应该从低开始,然后随着时代的增长而增长。但在这里它只在相同的值(0.93 和 0.95)内振荡。很抱歉,我无法上传图片来向您展示图表。
总而言之,我想知道准确性的微小差异是否意味着模型没有学习任何东西。
我有一个假设:在数据集的所有 100.000 张图像中,95.000 张的标签为“1”,只有 5.000 张的标签为“0”。我认为如果用“1”缩小图像将它们与“0”图像等同起来,结果会改变。
【问题讨论】:
标签: python tensorflow keras