【发布时间】:2018-09-21 18:26:12
【问题描述】:
具体来说,一步之内,它是如何训练模型的?梯度下降和反向传播的退出条件是什么?
这里的文档:https://www.tensorflow.org/api_docs/python/tf/estimator/Estimator#train
例如
mnist_classifier = tf.estimator.Estimator(model_fn=cnn_model_fn)
train_input_fn = tf.estimator.inputs.numpy_input_fn(
x={"x": X_train},
y=y_train,
batch_size=50,
num_epochs=None,
shuffle=True)
mnist_classifier.train(
input_fn=train_input_fn,
steps=100,
hooks=[logging_hook])
我理解,一步训练意味着我们一次向神经网络模型提供batch_size 多个数据点。我的问题是,在这一步中,它执行了多少次梯度下降?它是只执行一次反向传播和梯度下降,还是继续执行梯度下降,直到模型权重达到这批数据的最佳值?
【问题讨论】:
标签: tensorflow back backpropagation gradient-descent tensorflow-estimator