【发布时间】:2016-08-25 02:33:50
【问题描述】:
我有一个简单的 NN 模型,用于检测使用 Keras(Theano 后端)用 python 编写的 28x28px 图像中的手写数字:
model0 = Sequential()
#number of epochs to train for
nb_epoch = 12
#amount of data each iteration in an epoch sees
batch_size = 128
model0.add(Flatten(input_shape=(1, img_rows, img_cols)))
model0.add(Dense(nb_classes))
model0.add(Activation('softmax'))
model0.compile(loss='categorical_crossentropy',
optimizer='sgd',
metrics=['accuracy'])
model0.fit(X_train, Y_train, batch_size=batch_size, nb_epoch=nb_epoch,
verbose=1, validation_data=(X_test, Y_test))
score = model0.evaluate(X_test, Y_test, verbose=0)
print('Test score:', score[0])
print('Test accuracy:', score[1])
这运行良好,我的准确率约为 90%。然后我执行以下命令,通过执行print(model0.summary()) 来获取我的网络结构的摘要。这将输出以下内容:
Layer (type) Output Shape Param # Connected to
=====================================================================
flatten_1 (Flatten) (None, 784) 0 flatten_input_1[0][0]
dense_1 (Dense) (None, 10) 7850 flatten_1[0][0]
activation_1 (None, 10) 0 dense_1[0][0]
======================================================================
Total params: 7850
我不明白他们是如何达到 7850 个总参数的,这实际上意味着什么?
【问题讨论】:
-
快速说明:
nb_classes应该是 10(这是一个有 10 个类的多类问题)。 OP 中没有在这里提到它,但在这个问题的答案中的其他地方有几个地方提到了它。
标签: python machine-learning neural-network keras theano