【发布时间】:2018-03-28 01:01:28
【问题描述】:
所以我为二进制文本分类任务训练了一个 lstm rnn,我在理解损失结果时遇到了一些问题。训练集大约有 700 000 个示例,验证集大约有 35000 个示例。 验证集和训练集是独立的,所以我没有对验证集中的数据进行训练。 从我在学校学到的知识以及在查看其他一些帖子时,验证损失应该略高于训练损失,才能很好地适应。但是,在我的情况下,您可以看到验证损失波动很大。我正在使用二元交叉熵作为损失函数。
自从我将批大小设置为 128 以来,我每 300 批训练数据运行验证集。因此,每 300 批训练数据意味着算法已经大致通过验证集的大小,因此每 300 批感觉就像一个很好的测量点。
我不太明白如何解释这些结果。准确率很好,在 3 个 epoch 后的验证集上约为 79%,在训练集上为 78-82%。但我不确定我是否过拟合/欠拟合。
【问题讨论】:
-
训练集是否包含验证集,或者它们是独立的?
-
他们是独立的
标签: tensorflow machine-learning neural-network lstm rnn