【发布时间】:2018-10-07 13:10:32
【问题描述】:
训练 Keras 模型一次 64 个 epoch 和 64 次一个 epoch 有什么区别吗?
在这种情况下渐变如何工作?他们如何保存预览操作的历史以调整势头?
1)
model.fit(X, y, batch_size=64, epochs=64, verbose=False)
2)
for i in range(64):
verbose = (i % 16) == 0
if verbose:
print(i, end='')
model.fit(X, y, batch_size=64, epochs=1, verbose=verbose)
【问题讨论】:
-
没有区别。如果您更改批量大小,则会出现差异。 (对每批执行梯度下降)。
标签: python machine-learning keras gradient-descent