【发布时间】:2019-12-19 05:18:00
【问题描述】:
我指的是来自Keras 的fit 方法中的validation_split 参数:
validation_split:在 0 和 1 之间浮动。训练数据的分数 用作验证数据。该模型将区分这部分 的训练数据,不会对其进行训练,并将评估损失 以及每个 epoch 结束时有关此数据的任何模型指标。这 验证数据是从 x 和 y 数据中的最后一个样本中选择的 在洗牌之前提供。
我注意到默认值是 0 而不是传统的 0.2 或 0.33。我无法理解为什么他们选择使用 0 作为默认值,因为我认为没有验证集总是会导致训练过度拟合。我的假设错了吗?
【问题讨论】:
-
你的假设没有错,但可以说找出这种情况下到底发生了什么的最好方法是亲自进行实验。
-
没有验证集本身不会导致任何事情(过度拟合或其他);它只会限制 我们 看到我们的模型在看不见的数据上的实际性能。