【问题标题】:When to use Train Validation Test sets何时使用训练验证测试集
【发布时间】:2019-04-25 18:23:09
【问题描述】:

我知道这个问题很常见,但我已经查看了之前提出的所有问题,但我仍然不明白为什么我们还需要验证集。 我知道有时人们只使用一个训练集和一个测试集,那么为什么我们还需要一个验证集呢? 我们如何使用它? 例如,为了估算缺失数据,我分别估算这3个不同的集合吗?

谢谢!

【问题讨论】:

    标签: r validation testing split


    【解决方案1】:

    我会试着用一个例子来回答。

    如果我正在训练神经网络或进行线性回归,并且我只使用训练和测试数据,我可以检查每次迭代的测试数据丢失情况,并在测试数据丢失开始增长或获取快照时停止测试损失最低的模型。

    从某种意义上说,这对我的测试数据“过度拟合”,因为我根据此决定何时停止。

    如果我使用测试、训练和验证数据,我可以使用验证而不是测试数据执行与上述相同的过程,然后在我决定我的模型何时完成训练后,我可以在前所未有的情况下对其进行测试看到测试数据,以便为我的模型预测提供更公正的分数。

    对于问题的第二部分,我建议至少将测试数据视为独立的,并对缺失的数据进行不同的估算,但这取决于情况和数据。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-12-16
      • 2016-01-29
      • 2020-06-16
      • 2019-06-05
      • 2019-05-01
      • 2012-06-04
      • 2020-03-08
      相关资源
      最近更新 更多