【发布时间】:2020-05-10 00:52:33
【问题描述】:
数据增强仅适用于训练。我想知道为什么有几个教程会创建 test_generator 和 val_generator。我们为什么不只创建 train_generator。
【问题讨论】:
标签: machine-learning keras deep-learning neural-network data-augmentation
数据增强仅适用于训练。我想知道为什么有几个教程会创建 test_generator 和 val_generator。我们为什么不只创建 train_generator。
【问题讨论】:
标签: machine-learning keras deep-learning neural-network data-augmentation
实际上,将训练数据和验证数据分开是一种很好的做法。如果您只创建 1 个生成器,那么您很有可能使用相同的增强数据验证您的模型,这会给您的准确性带来偏差。此外,通常当我们有少量训练数据时,我们会使用数据增强,这会使事情变得更糟,最终得到高度偏差的模型。因此,我们应该分离数据并确保您的模型没有暴露于任何类型的验证数据,这样它就不会给您的性能增加任何偏差。
例如,您最终可能会训练图片 1 顺时针旋转的模型,并验证图片 1 逆时针旋转的模型。因此,我们通常用于确定过度拟合的验证准确度存在偏差,您最终可能会得到过度拟合的模型,但不知道训练期间何时发生。
【讨论】: