【问题标题】:Keras ValueError: No gradients provided for any variableKeras ValueError:没有为任何变量提供渐变
【发布时间】:2020-06-29 15:33:35
【问题描述】:

我已阅读相关主题但无法解决我的问题。

我目前正在尝试让我的模型运行,以便对 5000 个不同的事件进行分类,这些事件目前都属于同一类别(因此我的“标签”数据集由 5000 个 1 组成)。

我正在为我的标签数据集使用一种热编码:

labels = np.loadtxt("/content/drive/My Drive/5000labels1.csv")

from keras.utils import to_categorical
labels=to_categorical(labels) # convert labels to one-hot encoding

然后我像这样定义我的模型:

inputs = keras.Input(shape=(29,29,1))

x=inputs

x = keras.layers.Conv2D(16, kernel_size=(3,3), name='Conv_1')(x)
x = keras.layers.LeakyReLU(0.1)(x)      
x = keras.layers.MaxPool2D((2,2), name='MaxPool_1')(x)

x = keras.layers.Conv2D(16, kernel_size=(3,3), name='Conv_2')(x)
x = keras.layers.LeakyReLU(0.1)(x)
x = keras.layers.MaxPool2D((2,2), name='MaxPool_2')(x)

x = keras.layers.Conv2D(32, kernel_size=(3,3), name='Conv_3')(x)
x = keras.layers.LeakyReLU(0.1)(x)
x = keras.layers.MaxPool2D((2,2), name='MaxPool_3')(x)
x = keras.layers.Flatten(name='Flatten')(x)

x = keras.layers.Dense(64, name='Dense_1')(x)
x = keras.layers.ReLU(name='ReLU_dense_1')(x)
x = keras.layers.Dense(64, name='Dense_2')(x)
x = keras.layers.ReLU(name='ReLU_dense_2')(x)

outputs = keras.layers.Dense(4, activation='softmax', name='Output')(x)

model = keras.Model(inputs=inputs, outputs=outputs, name='VGGlike_CNN')
model.summary()

keras.utils.plot_model(model, show_shapes=True)

OPTIMIZER = tf.keras.optimizers.Adam(learning_rate=LR_ST)

model.compile(optimizer=OPTIMIZER,
              loss='categorical_crossentropy',
              metrics=['accuracy'],
              run_eagerly=False)

def lr_decay(epoch):
  if epoch < 10:
    return LR_ST
  else:
    return LR_ST * tf.math.exp(0.2 * (10 - epoch))

lr_scheduler = keras.callbacks.LearningRateScheduler(lr_decay)


model_checkpoint = keras.callbacks.ModelCheckpoint(
        filepath='mycnn_best',
        monitor='val_accuracy',
        save_weights_only=True, 
        save_best_only=True,
        save_freq='epoch')

callbacks = [ lr_scheduler, model_checkpoint ]    

print('X_train.shape = ',X_train.shape)

history = model.fit(X_train, epochs=50,
                    validation_data=X_test, shuffle=True, verbose=1,
                    callbacks=callbacks)

我收到错误消息:“没有为任何变量提供渐变:['Conv_1_2/kernel:0', 'Conv_1_2/bias:0', 'Conv_2_2/kernel:0', 'Conv_2_2/bias:0', ' Conv_3_2/kernel:0'、'Conv_3_2/bias:0'、'Dense_1_2/kernel:0'、'Dense_1_2/bias:0'、'Dense_2_2/kernel:0'、'Dense_2_2/bias:0'、'Output_2/ kernel:0', 'Output_2/bias:0']. "

根据我的阅读,这似乎很可能是由于损失函数的问题 - 但我不明白问题可能是什么。最终,我希望网络将事件分类为 4 个类别之一,因此我使用了分类交叉熵来获得与每个事件数量值相关的概率。

谁能帮助我?如果需要,我可以提供原始代码的 google colab 文件的链接。

提前致谢!

【问题讨论】:

    标签: python tensorflow machine-learning keras deep-learning


    【解决方案1】:

    你错过了目标

    model.fit(X_train, y_train, ..., validation_data = (X_test, y_test))
    

    【讨论】:

    • 这就是你的意思吗:from sklearn.model_selection import train_test_split train_to_test_ratio=0.8 #要包含在训练拆分中的数据集比例 X_train,X_test,Y_train,Y_test=train_test_split(NormEvents,labels,train_size= train_to_test_ratio)
    • 也许...您只需要一个适合您的网络的目标。我在您的代码中没有看到 Y_train,Y_test
    • 嗯...我正在关注另一个示例,其中测试/火车拆分的完成方式与我在上面评论中的 c&p'd 完全一样...这是错误的吗?
    • 对不起 - 我已经添加到我的 model.fit(X_train, Y_train,...) 中,现在我得到一个不同的错误!所以这是固定的,谢谢!
    猜你喜欢
    • 1970-01-01
    • 2020-04-26
    • 2021-03-24
    • 1970-01-01
    • 2016-10-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-07-29
    相关资源
    最近更新 更多